跳至內容

Archive.today

出自Taiwan Tongues 台語維基
這是此頁批准,以及是最近的修訂。

archive . today,閣稱archive . is抑是archive . ph,是一个私人資助的網頁存檔網站,資料中心是佇咧歐洲法國的北部-加來海峽。這个網站典藏檔案館來使用 Apache Hadoop 佮 Apache Accumulo 軟體。伊會當一改提轉去的一个類似 WebCite 的小於五十 MB 的頁面,並會使收錄 Google 地圖佮 Twitter。

archive . is 會根據著作權所有者的合數位千年著作權法案(DMCA)的撤除請求徙掉已存檔的頁面。

伊每擺請求攏會揣網頁的文字內容,載入無活動的元素抑是指令碼的 Web 二嬸零網站抑是由 JavaScript 產生的圖片佮框殼內容。截圖是一千空二十四 × 七百六十八像素,無快顯的畫面。

節甲二空一五年,archive . is 閣支援矣 Memento Project 的 API,並且開發矣 Firefox 瀏覽器佮 Chrome 瀏覽器的擴充功能。

封鎖

佇二空一五年七月二一,網站的管理人員封鎖矣芬蘭的 IP 位址,𪜶佇咧其 Twitter 上聲稱,按呢是為著避免佮芬蘭政府的糾紛升級。𪜶拒絕提供另外的資訊。佇網站嘛予中國佮哈薩克斯坦封鎖。這站仝款被 OpenDNS 封鎖。

好名

archive . is 捌濟擺換網路的名稱。

對建站初期到二空一四年四月十四是使用「Archive . is」(首字母為大寫)。

二空一四年四月十五,這个網站的名稱已經更加名做「archive . today」(首字母為小寫)。

二空一五年春季又閣改轉來矣「archive . is」(首字母為小寫)。

二空二一年夏季,網站採用「archive . today」為標題,主域名替換做「archive . ph」。

使用案例

這个檔案館會予一寡作者抑是駭客活動分子使用。

  • 有一寡線上使用者(比如講耍家門成員)使用伊檢視𪜶反對的網站的內容以避免向其貢獻網站流量。
  • 朱利安 ・ 阿桑奇《當 Google 拄著維基解密》(_ When Google Met WikiLeaks _)的一冊使用矣 archive . is 保留線頂引文。
  • 敘利亞電子軍使用伊證明𪜶入侵矣網站。

評論

佮網路檔案館無仝款時間的網路檔案館(_ Internet Archive Wayback Machine _)的主動性網路蜘蛛,archive . is 每擺干焦揣網站的一个頁面,所以無遵守「Robots 排除標準」。

> 對法律上講,archive . today 佮網際網路檔案館時光機有誠大無仝。網際網路檔案館的時光機掠網頁的時遵循通常的 Robots 指令,這款指令會當阻止其掠取特定的網頁。毋過,網站無法度阻止 archive . today 的使用者對其製作站點鏡像。 > >

參見

  • 網路存檔網站列表
  • Link rot
  • Perma . cc
  • WebCite
  • Web scraping
  • 網站時光機

參考文獻

外部連結

  • 官方網站
  • Archive . is blog 的 Tumblr 部落格
  • archive . today 的 Twitter 口座
  • Archive . today at CrunchBase