標籤: 資訊學習

HiNet 宣佈年底關閉 Proxy 服務

2018 年 9 月 17 日2021 年 3 月 12 日日落尚無留言

查了一下資料恍然大悟。HTTPS 主要目的就是希望所有的網路資料傳輸不會被中間人 (MITM) 竊聽，當然這個和 proxy 的目的剛好互斥，proxy 的行為就是做中間人並協助將常用檔案儲存起來讓你下次使用時可以快速取得。所以走 HTTPS 的話資料是不會進 proxy 做快取的。

ref:

資訊學習

2018 年 9 月 4 日2021 年 3 月 12 日日落尚無留言

Google 搜尋引擎提供了強大的功能，讓使用者可以快速的找到需要的資料。所有事物都有雙面刃的特性，也因此有人使用他來做惡意行為，像是搜尋個人隱私資訊、帳號密碼、網站架構、特定檔案等。

圖一：透過關鍵字和「filetype」搜尋到的聯絡人資訊

圖二：Google 也可找到一些可下載的檔案

早在 10 年前，我就使用這些搜尋技巧在網路上搜尋可用的電子書以及其他資料，只是已意外的到現在還有這麼多網站有安全問題。

搜尋引擎除了造訪各個網頁，並儲存網頁內容以外，會先參考網站根目錄的「robots.txt」檔案，此檔案主要目的是告訴搜尋引擎哪一些路徑不應該被建立索引、不該被搜尋：

通常會設定為：

User-agent: *
Allow: /
Disallow: /upload/
Disallow: /download/
Disallow: /file/

但要注意：並不是所有搜尋引擎都會按照你預期的方式處理。

同樣的，由於雙面刃的特性，當惡意使用者發現 robots.txt 中有「Disallow」的項目，就可以猜得到這些目錄有敏感資料，進而特別去分析這些目錄的用途。

這個作法很簡單，搜尋引擎造訪網頁時沒有帳號、密碼，無法讀取資料，也就沒辦法對網頁內容建立索引供使用者搜尋。

若有注意的話，你可以在 HTTP server log 中看到 user agent 的資訊，例如：

 .... Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)

順著 user agent 的提示，你應該會發現多數的搜尋引擎 bot 都會有關鍵字，且有些搜尋引擎服務甚至會告知 bot 所使用的 IP。透過這些設定，設定防火牆或其存取規則，來阻擋搜尋引擎讀取特定網頁。

ps. 十多年前，百度的 bot 會在一秒內同時送出數十個 HTTP request 來檢索網頁，導致機器被DoS。後來不爽把所有中國網段全部用防火牆給擋了 … Orz

2018 年 8 月 31 日2021 年 3 月 12 日日落尚無留言

近日有 YouTuber 被告知不可隨意使用特定字型，否則會發法律上的問題。

看到法操 FOLLAW 整理了與電腦字型有關的法律規範出來，做個筆記。

以下節錄自「用新細明體和標楷體做影片字幕一定會構成侵害嗎？」：
我國著作權法在民國81年修正前，當時規範著作物類型的第3條並未將字型納入著作權的保障範圍。但隨著字型的議題受到重視，在民國81年修正著作權法時，將著作物類型移列第5條，並由行政機關針對各個類型的範圍另以命令規定。

因此，行政機關依據上述條文的授權，訂立並公告了《著作權法第五條第一項各款著作內容例示》，來明確說明第5條各著作物的詳細內容。而在該例示中，行政機關順應當時的需求，將「字型繪畫」納入了「美術著作」的範圍。

個人認為，目前法律好像還沒跟上資訊發展的速度，因此有一些模糊地帶、也可能造成一些糾紛。

已有其他網友整理出目前常用字型的使用法律授權：YouTuber 合法使用中文字型的管道有哪些？。有需要時可供參考。

Reference

2018 年 8 月 7 日2021 年 3 月 12 日日落尚無留言

發現手上一個 domain 的 HTTP cert 過期沒被更新到，但 dehydrated 理應會自動檢查到過期的憑證才對：

/etc/nginx/cert/dehydrated -c > /dev/null 2>&1; service nginx reload

手動執行 dehydrated 以後，發現有個 domain 已經被我刪除，而 dehydrated 遇到這個錯誤以後就會中斷執行，也因此後面幾個 domain 都沒有被檢查。

翻了文件，加上「–keep-going」參數，即可讓 dehydrated 遇到錯誤繼續往下走。

資訊學習

2018 年 7 月 30 日2021 年 3 月 12 日日落尚無留言

給定一個 array：

$list = [
    '200' => 'OK',
    '404' => 'not found',
    '500' => 'internal server error',
];

使用 array_keys() 取得 keys 以後，key 的資料型態若可以被轉為 int 則會被自動轉換：

$keys = array_keys($list);

// array(3) {
//   [0]=>
//   int(200)
//   [1]=>
//   int(404)
//   [2]=>
//   int(500)
// }

由文件中可以看到，透過第三個參數「$strict」可以要求保留原始資料型態，但無法避開第二個參數「$search_value」。所以第三個參數基本上是放好看的 (WTF)

如果要處理的資料是比較敏感的，建議在 key 前面加個 prefix，或是取得 keys 以後再手動轉換資料型態。

PHP, 資訊學習