深網
深網,即深層網站(英語:Deep web), 是講袂使予人標準搜揣 ia̋n-jín 索引的全球資訊網內容。佮深網反倒轉的術語是表網,逐項人攏會使用網際網路咧貯。
深網會當直接透過的 URL 抑是 IP 位址存取,猶毋過可能著愛輸入密碼抑是其他的安全資訊才會當存取實際內容。這類網站用途包括網路郵件、網路銀行、限制存取的社群媒體頁面佮資料猶閣有使用者必須付費閣受著付費牆保護的服務,親像選視訊、網路雜誌佮報紙等。
名詞
二空空九年,深網佮暗網這兩个名詞頭擺予人透濫做一談,當時討論了深網概念以及自由網佮烏暗網路發生的非法活動。遮的犯罪活動包括個人密碼、造假身分證件、毒品、銃枝佮囡仔色情交易。
自彼陣仔起,佇媒體報導絲綢了後,媒體開始使用深網作為烏暗網站抑是烏暗網路的同義詞,致使長期的混亂。Wired 記者 Kim Zetter 和 Andy Greenberg 建議使用無仝的方式使用遮的術語。雖然深網是講無法度利用傳統的搜揣 ia̋n-jín 存取的任何網站,毋過暗網仔只是深網的一部份,予人刻意隱藏並且無法度利用一般瀏覽器佮方法進入。
號名
伯格曼在 _ The Journal of Electronic Publishing _ 上發表一篇關於深網的重大論文中講著,吉爾。艾爾斯沃夫捌使用「隱形網」這一術語表示彼無去予任何搜揣 ia̋n-jín 索引註冊的網站。伯格曼閣參照法蘭克 ・ 加西亞佇一九九六年一月的一篇文章:
> 這網站可能已經予人合理地設計出來矣,但是𪜶煞無去予任何搜揣 ia̋n-jín 編列索引,所以甚至事實上無人會當揣著𪜶。我會當按呢對這不可見的網站講,恁藏了的呢。我講的是隱形網。 > >
古早另外一个使用「隱形網」這術語的是一家叫做「個人的圖書館軟體」公司的彼个布魯斯 ・ 菅芒特佮馬修 ・ B ・ 科爾,做𪜶公司佇一九九六年十二月推出佮發行的一款軟體的時,𪜶對深網工具的有這款的一番描述。
這馬普遍接受的深網這一特定術語頭擺使用佇二空空一年伯格曼的研究中。二空空一年,電腦科學家麥可 ・ 伯格曼將當今全球資訊網頂懸的搜尋服務比喻做親像佇咧地球的海洋表面的搝起一个大網的搜尋,巨量的表面資訊固然會當透過這種方式被走揣會著,毋過閣有相當大量的資訊因為隱藏佇咧深的所在 ia̋n-jín 錯失去。絕大部份遮的隱藏的資訊是愛透過動態請求產生的網頁資訊,標準的搜揣 ia̋n-jín 煞無法度對其進行走揣。傳統的搜揣 ia̋n-jín「看」無到,嘛取得袂遮的存在佇咧深網的內容,除非透過特定的搜查遮的頁面才會動態產生。所以對出來,網仔藏起來就藏。據估計,深網愛比表網路大幾个數量級。
深網資源
防止網頁予傳統搜揣 ia̋n-jín 索引的方法會當予人分類以後一个抑是真濟个:
一 .予人限制存取的內容:用技術方式限制存取其網頁的網站,比如講 Robots . txt、CAPTCHAs 抑是禁止搜揣 ia̋n-jín 建立緊取。 二 .非 HTML 抑是文字的內容:圖像抑是影片等等的多媒體抑是講特定的檔案無法度予人搜揣 ia̋n-jín 處理。 三 .私人網站:需要註冊抑是登入的網站。 四 .軟體:某一寡內容刁工隱藏佇一般的網路頂懸,干焦會當用特殊軟體如 Tor、I 二 P 抑是其他的程式存取。比如講 Tor 予使用者無頭人 . onion 網址的網站,以隱藏𪜶的 IP 位址。 五 .無去予人連結的內容:未來予其他的網站做連結抑是足少連結的網頁,這可能防止予網路爬蟲的存在。 六 .網站檔案管理庫:網站時光機這類網站內容的網頁無法度予人搜揣 ia̋n-jín 編入索引。
掠這个深網的內容
研究人員探揣了如何自動掠取深網仔內容。
二空空一年,斯利拉姆 ・ 拉格哈瓦(Sriram Raghavan)佮赫克托 ・ 加西亞 ・ 不利納(Hector Garcia-Molina)發明一个對使用者請求介面表格收集關鍵詞的深網掠模型並且掠這个深網資源。加利福尼亞大學洛杉磯分校的 Alexandros Ntoulas、Petros Zerfos 和 Junghoo Cho 建立一个自動生成有意義的查詢詞的程式。
商業揣頭路 ia̋n-jín 已經開始咧使用矣以上兩種方法之一掠深網仔。Sitemap 協定(由 Google 佇二空空五年頭一改開發並由 Google 引入來)和 mod oai 是允准搜揣 ia̋n-jín 佮其他網路服務探索深網解決方法。以上兩種解決方法允准網路服務主動公佈網址,這對𪜶來講是誠簡單的,允准自動探尋資源顛倒無直接透過網路表面的連結。Google 的深網探尋系統預先計算逐个 HTML 表單並且添加結果 HTML 頁面到 Google 搜揣 ia̋n-jín 索引。佇這个系統內底,使用三種方法計算提交詞:
一 . 為輸入搜揣選擇關鍵詞允准的輸入值, 二 . 確定敢有干焦接受著特定的值(比如講時間), 以及山 . 選擇少量的組合生成適合納入網站的搜揣引網址。
二空空八年,為著方便 Tor 隱藏服務的使用者存取佮搜揣隱藏的 . onion 網域,亞倫 ・ 斯沃茨設計矣 Tor 二 web—一个會當利用普通瀏覽器存取的代理應用程式。
參見
- 暗網