<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Anthropic「蒸餾」了人類最大的知識庫

      0
      分享至

      2024 年初,在美國某處的一座倉庫里,工人們正在做一件看起來有些奇怪的事:把書一本本送進機器,切掉書脊,掃描,然后把剩下的紙送去回收。

      這些書是剛買來的,有些甚至是新的。沒有人會讀它們,它們存在的唯一目的,就是被銷毀。

      下令做這件事的,是一家叫 Anthropic 的 AI 公司。


      在他們的內部文件里,這項計劃有個代號:「巴拿馬項目」。一份規劃文件寫得很直白:「這是我們以破壞性方式掃描全球所有書籍的計劃,我們不希望外界知道我們正在做這件事。」

      這件事最終還是被人知道了。

      去年,一名聯邦法官解封了一批與版權訴訟相關的文件,總計超過 4000 頁。外界由此看到的,不只是一家公司的秘密,而是整個 AI 行業在數據爭奪戰中的真實面目。

      被大模型「吃」掉的實體書

      為什么這些處于技術前沿的科技巨頭,會用如此原始甚至粗暴的方式對待紙質書?答案其實藏在 AI 對高質量數據的極度渴求里。

      Anthropic 內部很早就意識到,訓練 AI 模型光靠網絡上的內容不夠用。

      根據《華盛頓郵報》報道,一位Anthropic 聯合創始人在 2023 年 1 月的文件中寫道,用書籍訓練模型,可以讓 AI 學會「如何寫得更好」,而不是只會模仿質量參差不齊的網絡語言。

      書籍經過嚴格編輯和校對,內容結構清晰,是網絡文本難以替代的高質量語料。

      這個邏輯本身并不難理解,但問題是,既然承認書籍有價值,為什么不付錢?究其原因,挨個找出版社和作者談授權,費時費力,成本也高。于是 Anthropic 啟動了「巴拿馬項目」。一句「不希望外界知道」,說明它也清楚這件事站不住腳。

      甚至「巴拿馬項目」還沒啟動的時候,Anthropic 已經嘗試通過另一種方式獲取書籍。


      法院文件顯示,公司聯合創始人 Ben Mann 曾在 2021 年 6 月的 11 天里,從一個叫 LibGen 的網站下載了大量小說和非小說類書籍。LibGen 是個「影子圖書館」,上面的資源大多涉嫌侵權,文件中附帶的瀏覽器截圖顯示,他使用文件共享軟件完成了這些下載。

      一年后,另一個網站 Pirate Library Mirror 于 2022 年 7 月上線,該網站公開宣稱「在大多數國家故意違反版權法」。Mann 把這個網站的鏈接發給了其他 Anthropic 員工,并留言寫道:「來得正是時候?。?!」

      這句感嘆號背后,是一位公司高管對一個公開承認違法的盜版網站表達的真實態度。

      Anthropic 事后表示,公司從未用這些數據訓練過正式發布的商業模型。但這種解釋多少有些勉強,下載了,存著,只是「沒有用在正式模型上」,這條線究竟劃在哪里,恐怕連 Anthropic 自己也說不清楚。

      為了「巴拿馬項目」,Anthropic 還專門聘請了 Tom Turvey 來主持這項工作。Turvey 曾參與創建谷歌圖書項目,那個項目同樣因大規模掃描書籍引發了長達多年的版權爭議。Anthropic 選擇這個人來主導這件事,很難說是一種巧合。


      最終,Anthropic 主要依賴兩家書商批量供貨:

      美國二手書零售商 Better World Books,以及總部位于英國的 World of Books,每次采購動輒數萬冊。內部文件還顯示,員工曾討論接洽紐約公共圖書館,甚至提到可以找某家長期資金不足的新圖書館。

      采購完之后,整個掃描過程,就像一條工業流水線。


      供應商用液壓切割機把書脊整齊切掉,散開的書頁隨即被送進高速工業掃描儀,掃完之后,剩下的紙張交給回收公司處理。一家參與報價的掃描服務商在提案中寫道,Anthropic 希望在六個月內完成 50 萬到 200 萬冊書的數字化工作。

      Anthropic 副總法律顧問 Aparna Sridhar 回應稱,法院已裁定 AI 訓練「本質上具有轉化性」,Anthropic 選擇和解的問題在于「部分材料的獲取方式,而不是我們是否可以使用這些材料」。

      這套說辭在法律上也許站得住腳,但它同時也揭示了一件事:這家公司從未認為自己做錯了什么,只是某些手段不夠干凈。

      拿你的書訓練,再搶你的飯碗

      同樣的事情,也在其他公司身上發生著,而且有些細節更為戲劇性。

      針對 Meta 的訴訟文件顯示,有員工在 2023 年直接寫道:「用公司筆記本進行種子下載感覺不太對勁?!顾髞磉€專門向法務團隊反映,稱使用種子網站可能意味著向他人分發盜版作品,「這在法律上可能行不通。」

      但這些顧慮最終沒有改變任何事情。

      2023 年 12 月的一封內部郵件顯示,使用 LibGen 已在「上報至 MZ」之后獲批,MZ 指的是 CEO 馬克·扎克伯格。郵件還坦率地寫明了他們自己都清楚的風險:「如果媒體報道暗示我們使用了已知為盜版的數據集,這可能會削弱我們在監管問題上的談判立場。」


      換句話說,他們不是不知道這樣做不對,只是在權衡被抓包的代價。為了降低這個風險,員工們特意租用亞馬遜的服務器來做種子下載,而不是用 Meta 自己的服務器,原因是避免被追蹤到 Meta 公司。

      OpenAI 和微軟同樣面臨圖書作者的版權指控。OpenAI 甚至承認曾下載過 LibGen,但稱在 ChatGPT 發布前已刪除相關文件。

      而 AI 公司與創作者之間的版權沖突,并非從 Anthropic 才開始。

      早在 2000 年代初,Google 就曾大規模掃描圖書館館藏,同樣引發了長達十年的訴訟。最終法院認定Google 的做法屬于「合理使用」,因為它只提供片段摘要,目的是引導讀者找到書,而不是取代書本身。

      這個判決在當時看來合情合理,卻在二十年后為整個 AI 行業提供了一塊擋箭牌。

      Google 圖書是個索引工具,而生成式 AI 直接消化書籍內容,然后輸出文字,在某些情況下與作者產生直接競爭。性質變了,但援引的法律邏輯還是同一套,這本身就值得思考。


      去年 6 月,聯邦法官 William Alsup 裁定,Anthropic 用書籍訓練 AI 屬于合法行為,他將這個過程比作教師「訓練學生寫好文章」。這個比喻聽起來溫和,但現實中的老師不會同時訓練幾百萬個學生,也不會靠這些學生賺幾十億美元。

      最終,Anthropic 選擇支付 15 億美元和解金,在 AI 版權訴訟史上創下紀錄,但細看之下,賬算得并不虧。按照美國版權法,每件作品的法定賠償上限可達 15 萬美元,而此次和解折算下來,每本書約賠 3000 美元,僅為上限的 2%。

      賠償金由作者和出版商平分,只是,這一安排在創作者群體內部引發了爭議。

      不少作者認為,出版商在保護作品不被 AI 濫用這件事上沒有盡力,卻拿走了一半賠償。更關鍵的是,和解協議并不要求 Anthropic 承認任何違法行為,法院對「AI 訓練屬于合理使用」的認定照樣有效。


      換句話說,Anthropic 用 15 億美元買到的,不只是和解,還有一份背書:我們可以繼續這么做。有分析人士指出,隨著這個先例確立,版權侵權對 AI 公司來說已經不再是一條紅線,而是一筆可以提前計入成本的「過路費」。

      對許多寫書的人來說,這件事意味著的遠不止一張支票。美國作家的年收入中位數約為 2 萬美元,而市值數千億的 AI 公司在未獲授權的情況下大量使用他們的作品,事后折算的賠償標準遠低于法律上限。

      更讓人憂慮的是,AI 正在批量生成文字內容,這些低成本的文本涌入市場,讓原本就艱難的寫作謀生變得更難。訓練 AI 用的是人寫的書,而 AI 產出的內容,正在擠壓人繼續寫書的空間,循環往復。

      支持者自有另一套邏輯:AI 并不儲存書里的內容,而是從中提取語言規律,這更像是一個人博覽群書之后形成自己的表達。這個類比并非毫無道理,但卻省略了一個關鍵差異:


      人讀了一本書,不會同時讀一百萬本;而 AI 在幾個月內消化了人類幾十年的寫作積累,隨后以極低的邊際成本無限復制輸出,規模改變了性質,把兩件事等同起來其實并不合理。

      數百萬冊書被切開、掃描、回收,最后換來一份和解協議。那些書,早已不在了。而 AI 還在繼續寫作,且會越來越快。這大概就是這件事最讓人不安的地方:對于書被銷毀,被肆意用來訓練 AI 這件事,沒有人真正付出了代價。

      附上參考地址:
      https://www.washingtonpost.com/technology/2026/01/27/anthropic-ai-scan-destroy-books/

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      換掉原女主,陳麗君救了吳京《鏢人》!看了面試,才明白為何選她

      換掉原女主,陳麗君救了吳京《鏢人》!看了面試,才明白為何選她

      頭號電影院
      2026-02-23 13:09:53
      賽季報銷!威廉姆斯左膝前交叉韌帶撕裂 爵士主帥不滿伊森動作

      賽季報銷!威廉姆斯左膝前交叉韌帶撕裂 爵士主帥不滿伊森動作

      羅說NBA
      2026-02-25 05:57:46
      央視重磅官宣:殲16單機雙鎖兩架F-22,外軍隱身戰機嚇得再不敢來

      央視重磅官宣:殲16單機雙鎖兩架F-22,外軍隱身戰機嚇得再不敢來

      52赫茲實驗室
      2026-02-23 12:43:04
      45歲張柏芝在上海街邊被偶遇,她穿著羽絨服,臉蛋圓潤,好漂亮

      45歲張柏芝在上海街邊被偶遇,她穿著羽絨服,臉蛋圓潤,好漂亮

      草莓解說體育
      2026-02-25 02:51:18
      90后男生上門喂貓,春節前后20多天賺16萬,最多1天跑55單只睡3小時,律師提醒:上門喂貓需提前明確責任

      90后男生上門喂貓,春節前后20多天賺16萬,最多1天跑55單只睡3小時,律師提醒:上門喂貓需提前明確責任

      瀟湘晨報
      2026-02-18 16:28:53
      夫妻春節不回家送外賣1個月賺4萬,騎手站長:青島春節補貼最高8200元,月入2萬日均需跑約70單

      夫妻春節不回家送外賣1個月賺4萬,騎手站長:青島春節補貼最高8200元,月入2萬日均需跑約70單

      大風新聞
      2026-02-24 15:44:14
      4-3絕殺!斯諾克中國德比:趙心童險勝范爭一!下輪對手也確定了

      4-3絕殺!斯諾克中國德比:趙心童險勝范爭一!下輪對手也確定了

      球場沒跑道
      2026-02-24 23:05:03
      高盛:AI去年對美國GDP貢獻幾乎為零

      高盛:AI去年對美國GDP貢獻幾乎為零

      財聯社
      2026-02-24 16:04:31
      煮湯圓,有人用開水,用冷水!廚師長:都不對,教您做法,不粘鍋

      煮湯圓,有人用開水,用冷水!廚師長:都不對,教您做法,不粘鍋

      阿龍美食記
      2026-02-23 17:09:09
      阿爾茨海默病者逐漸增多,醫生提醒:55歲后,盡量改掉6個壞習慣

      阿爾茨海默病者逐漸增多,醫生提醒:55歲后,盡量改掉6個壞習慣

      39健康網
      2026-02-17 18:31:37
      一箱油可橫跨北美 本田新型小飛機賣爆:購買意向達產能10倍

      一箱油可橫跨北美 本田新型小飛機賣爆:購買意向達產能10倍

      快科技
      2026-02-24 08:21:03
      75歲張藝謀再掀桌:比748萬罰款更狠的,是陳婷留的這一手!

      75歲張藝謀再掀桌:比748萬罰款更狠的,是陳婷留的這一手!

      手工制作阿殲
      2026-02-24 16:41:37
      江蘇一家去貝加爾湖旅游:一萬六都花了,卻為省200全家遇難

      江蘇一家去貝加爾湖旅游:一萬六都花了,卻為省200全家遇難

      觀察鑒娛
      2026-02-24 09:48:21
      王健林再為萬達續命25億元,他比許家印爺們!

      王健林再為萬達續命25億元,他比許家印爺們!

      毒sir財經
      2026-02-24 22:34:10
      一路走好!2026春節才過7天,已有6位大佬離世,最年輕的才40歲

      一路走好!2026春節才過7天,已有6位大佬離世,最年輕的才40歲

      鯨探所長
      2026-02-24 19:34:36
      明星卸妝后,曾黎臉蠟黃,王子文像老阿姨,看到王一博后我驚呆了

      明星卸妝后,曾黎臉蠟黃,王子文像老阿姨,看到王一博后我驚呆了

      最美的開始
      2026-02-24 19:00:14
      騎士109-94尼克斯!無解的不是贏球,而是哈登賽后對米切爾的表態

      騎士109-94尼克斯!無解的不是贏球,而是哈登賽后對米切爾的表態

      魚崖大話籃球
      2026-02-25 12:31:48
      歷史上唯一一位“女狀元”,白天處理政務,晚上淪為玩物

      歷史上唯一一位“女狀元”,白天處理政務,晚上淪為玩物

      談史論天地
      2026-02-23 10:39:15
      何超瓊身價突破700億,3位保鏢一同出行,手里的包包成為亮點

      何超瓊身價突破700億,3位保鏢一同出行,手里的包包成為亮點

      素素娛樂
      2026-02-24 08:11:21
      你火鍋里的肥牛,可能根本就沒見過牛

      你火鍋里的肥牛,可能根本就沒見過牛

      富貴說
      2026-02-23 17:59:39
      2026-02-25 12:40:49
      愛范兒 incentive-icons
      愛范兒
      消費科技第一媒體
      38455文章數 2600971關注度
      往期回顧 全部

      科技要聞

      蘋果MacBook Pro要加觸摸屏了,還帶靈動島

      頭條要聞

      牛彈琴:美伊大戰若還不打 全世界都會看特朗普的笑話

      頭條要聞

      牛彈琴:美伊大戰若還不打 全世界都會看特朗普的笑話

      體育要聞

      曝雄鹿計劃今夏追小卡 字母哥渴望與其并肩作戰

      娛樂要聞

      撒貝寧到沈陽跑親戚 老婆李白模特身材

      財經要聞

      春節檔"開門黑" 電影票少賣了7000萬張

      汽車要聞

      750km超長續航 2026款小鵬X9純電版將于3月2日上市

      態度原創

      游戲
      房產
      家居
      公開課
      軍事航空

      茅臺佐熱血,壕出圈的傳奇新百區合擊,究竟有何底氣?

      房產要聞

      330萬人涌入!春節全國樓市,第一個賣爆的區域出現了!

      家居要聞

      藝居辦公 溫度與效率

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      俄烏沖突四周年:和平談判希望渺茫

      無障礙瀏覽 進入關懷版