Archive.today
archive . today,閣稱archive . is抑是archive . ph,是一个私人資助的網頁存檔網站,資料中心是佇咧歐洲法國的北部-加來海峽。這个網站典藏檔案館來使用 Apache Hadoop 佮 Apache Accumulo 軟體。伊會當一改提轉去的一个類似 WebCite 的小於五十 MB 的頁面,並會使收錄 Google 地圖佮 Twitter。
archive . is 會根據著作權所有者的合數位千年著作權法案(DMCA)的撤除請求徙掉已存檔的頁面。
伊每擺請求攏會揣網頁的文字內容,載入無活動的元素抑是指令碼的 Web 二嬸零網站抑是由 JavaScript 產生的圖片佮框殼內容。截圖是一千空二十四 × 七百六十八像素,無快顯的畫面。
節甲二空一五年,archive . is 閣支援矣 Memento Project 的 API,並且開發矣 Firefox 瀏覽器佮 Chrome 瀏覽器的擴充功能。
封鎖
佇二空一五年七月二一,網站的管理人員封鎖矣芬蘭的 IP 位址,𪜶佇咧其 Twitter 上聲稱,按呢是為著避免佮芬蘭政府的糾紛升級。𪜶拒絕提供另外的資訊。佇網站嘛予中國佮哈薩克斯坦封鎖。這站仝款被 OpenDNS 封鎖。
好名
archive . is 捌濟擺換網路的名稱。
對建站初期到二空一四年四月十四是使用「Archive . is」(首字母為大寫)。
二空一四年四月十五,這个網站的名稱已經更加名做「archive . today」(首字母為小寫)。
二空一五年春季又閣改轉來矣「archive . is」(首字母為小寫)。
二空二一年夏季,網站採用「archive . today」為標題,主域名替換做「archive . ph」。
使用案例
這个檔案館會予一寡作者抑是駭客活動分子使用。
- 有一寡線上使用者(比如講耍家門成員)使用伊檢視𪜶反對的網站的內容以避免向其貢獻網站流量。
- 朱利安 ・ 阿桑奇《當 Google 拄著維基解密》(_ When Google Met WikiLeaks _)的一冊使用矣 archive . is 保留線頂引文。
- 敘利亞電子軍使用伊證明𪜶入侵矣網站。
評論
佮網路檔案館無仝款時間的網路檔案館(_ Internet Archive Wayback Machine _)的主動性網路蜘蛛,archive . is 每擺干焦揣網站的一个頁面,所以無遵守「Robots 排除標準」。
> 對法律上講,archive . today 佮網際網路檔案館時光機有誠大無仝。網際網路檔案館的時光機掠網頁的時遵循通常的 Robots 指令,這款指令會當阻止其掠取特定的網頁。毋過,網站無法度阻止 archive . today 的使用者對其製作站點鏡像。 > >
參見
- 網路存檔網站列表
- Link rot
- Perma . cc
- WebCite
- Web scraping
- 網站時光機
參考文獻
外部連結
- 官方網站
- Archive . is blog 的 Tumblr 部落格
- archive . today 的 Twitter 口座
- Archive . today at CrunchBase