IT之家 4 月 14 日消息,據 Wired 報道,本月,《USA Today》刊發了一篇出色的報道,揭露了美國移民與海關執法局如何拖延披露其拘留政策影響的關鍵信息。報道作者利用互聯網檔案館(Internet Archive)的“時光機(Wayback Machine)”工具,整理并分析了該機構的拘留統計數據,追蹤其在特朗普政府時期的變化。這只是“時光機”為公共利益保存信息的無數案例之一,這款工具會抓取并留存網頁內容。而據“時光機”負責人馬克 · 格雷厄姆稱,這件事本身“頗具諷刺意味”。
![]()
《USA Today》集團(前身為甘尼特集團,運營著同名報紙及 200 多家其他媒體),卻禁止“時光機”存檔其內容。格雷厄姆表示:“他們能完成這篇調查報道,正是因為‘時光機’的存在。可與此同時,他們卻在封禁訪問權限。”
近期,其他多家美國主流新聞機構也開始限制“時光機”存檔其報道,其中包括《紐約時報》。據人工智能檢測初創公司 Originality AI 分析,目前已有 23 家主流新聞網站屏蔽了“ia_archiverbot”—— 這是互聯網檔案館為“時光機”項目使用的網絡爬蟲。社交平臺 Reddit 也采取了同樣做法。另有媒體以其他方式加以限制:《衛報》并未屏蔽爬蟲,但將其內容排除在互聯網檔案館 API 之外,并在“時光機”界面中過濾相關文章,導致普通用戶更難查閱其存檔內容。
《USA Today》集團發言人拉克-瑪麗 · 安東強調,此舉“并非專門針對互聯網檔案館”,而是該機構全面封禁所有爬蟲程序的舉措之一。《衛報》商務與授權總監羅伯特 · 哈恩則稱,該報正與互聯網檔案館溝通,原因是“擔憂人工智能公司可能濫用為存檔目的抓取的內容”。
如今,記者們正自發抵制這一趨勢。本周,電子前沿基金會、為未來而戰等倡導組織聯合記者聲援“時光機”。該聯盟收集到逾百名在職記者的簽名,他們認可這款工具的價值,并向互聯網檔案館遞交了支持信。聯署者既有知名電視主播蕾切爾 · 瑪多,也包括獨立媒體記者。信中寫道:“在過去,記者會查閱地方報紙或公共圖書館的實體檔案,調取歷史報道,追溯當下事件的來龍去脈。如今大量報紙關停,地方公共圖書館又缺乏明確途徑保存純數字新聞,守護新聞記錄的責任越來越多地落在互聯網檔案館身上。”
聯署人、《攔截》播客監制勞拉 · 弗林表示,互聯網檔案館在其職業生涯中是“不可或缺的工具”,在事實核查與音頻片段檢索方面發揮了關鍵作用。另一位聯署人、《芝加哥讀者》撰稿人米科 · 卡波拉爾稱,撰寫老牌樂隊與文化人物相關報道時,“時光機”能提供已消失的舊時粉絲網站內容,否則這些資料將徹底湮沒。
卡波拉爾還表示,這款工具在其工會組織者工作中同樣實用。“我在工會組織工作中大量使用‘時光機’,查找舊招聘信息,對比公司宣稱的招聘崗位與實際分配的工作內容,或是查看不同職位在不同時期的調整情況。這些帖子還能幫我們追蹤機構內部長期的薪資波動。”
其他出版商則以擔憂科技公司利用互聯網檔案館數據訓練人工智能模型為由,為封禁“時光機”的決定辯護。《紐約時報》發言人格雷厄姆 · 詹姆斯稱:“問題在于,互聯網檔案館中的時報內容正被人工智能公司用于訓練,違反版權法,與我們形成直接競爭。”(時報方面未說明這是既成事實,還是僅為假設性擔憂。)
Reddit 此前也曾表示,對人工智能的擔憂同樣促使其屏蔽“時光機”爬蟲。出版商與人工智能公司之間正圍繞 AI 工具未經許可使用其內容訓練的合法性展開激烈博弈;美國逾百起人工智能版權訴訟中,多數都聚焦這一問題。科技公司會抓取全網內容,而“時光機”擁有海量資料,因此被視為極具吸引力的數據來源。
據IT之家了解,互聯網檔案館已成立 30 年,存檔網頁超一萬億個。這家非營利機構自 2020 年以來歷經多場重大法律訴訟。最近,其與一批主流音樂出版商達成和解,后者曾就其“偉大 78 轉唱片”項目(存檔老式錄音)索賠高達 7 億美元。盡管目前暫無重大經濟處罰風險,但越來越多媒體機構封禁“時光機”,仍對其使命構成嚴重威脅。
目前尚無公開工具能與“時光機”媲美。若其持續失去主流新聞來源的訪問權限,其存檔工作將大幅受損,早期數字歷史記錄會變得難以查閱,甚至徹底遺失。值得注意的是,這款工具曾被用于針對《紐約時報》的報道:2016 年,該報因修改一篇關于佛蒙特州聯邦參議員、時任總統候選人伯尼 · 桑德斯的文章編輯內容而受到質疑,這些修改正是通過“時光機”首次被追蹤到的。
若類似事件如今發生,監督類媒體記者可能難以用同樣方式追溯時報舊文版本。功能受限的“時光機”不僅不利于監督新聞業,還會對司法體系造成打擊,該工具存檔的網頁在美國各類訴訟中常被作為證據引用。
互聯網檔案館的馬克 · 格雷厄姆并未放棄希望,認為部分當前封禁其爬蟲的出版商最終可能改變態度。他表示,這家非營利機構正與《紐約時報》等媒體“溝通協商”。但就目前而言,格雷厄姆稱:“毫無疑問,公共網絡越來越多的內容被封鎖,正在削弱社會了解世界真相的能力。”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.