<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      AI大語言模型可逐字復制訓練數據中的小說

      0
      分享至


      全球頂尖的AI模型可以被誘導生成暢銷小說的近似逐字復制內容,這給AI行業聲稱其系統不存儲版權作品的說法帶來了新的質疑。

      最近的一系列研究顯示,來自OpenAI、谷歌、Meta、Anthropic和xAI的大語言模型對訓練數據的記憶程度遠超此前預期。

      AI和法律專家向《金融時報》表示,這種"記憶"能力可能對AI集團在全球數十起版權訴訟中的抗辯產生嚴重影響,因為它削弱了他們的核心防御論點——大語言模型從版權作品中"學習"但不存儲副本。

      "越來越多的證據表明,記憶現象比此前認為的更為普遍,"倫敦帝國理工學院應用數學和計算機科學教授伊夫-亞歷山大·德·蒙喬伊說。

      AI集團長期以來一直聲稱不會發生記憶現象。在2023年致美國版權局的信件中,谷歌表示"模型本身不存在訓練數據的副本——無論是文本、圖像還是其他格式"。

      AI行業還聲稱,使用版權書籍訓練模型屬于"合理使用",認為該技術將原始作品轉化為有意義的新內容。

      但上個月發表的一項研究顯示,斯坦福大學和耶魯大學的研究人員能夠策略性地誘導來自OpenAI、谷歌、Anthropic和xAI的大語言模型生成13本書中的數千個單詞,包括《權力的游戲》、《饑餓游戲》和《霍比特人》。

      通過要求模型完成書中的句子,Gemini 2.5以高度準確性復制了《哈利波特與魔法石》的76.8%,而Grok 3生成了70.3%。

      他們還能夠通過"越獄"Anthropic的Claude 3.7 Sonnet模型,幾乎完整地"近似逐字"提取整部小說,越獄是指用戶可以誘導大語言模型無視其安全防護。

      這項研究建立在去年一項研究的基礎上,該研究發現Meta的Llama等"開放"模型會記憶訓練數據中特定書籍的大部分內容。

      AI專家此前不確定通常具有更多安全防護以防止模型生成不當內容的封閉模型是否也容易出現大規模記憶現象。

      "令人驚訝的是,盡管有防護措施,它們仍能記憶整個文本,"參與該研究的耶魯大學研究員A·費德·庫珀說。

      研究人員尚未弄清楚大語言模型為什么會記憶出現在訓練數據中的內容。目前也不清楚有多少訓練數據在其生成的輸出中顯現。

      這種記憶特性在醫療保健和教育等其他領域也可能產生嚴重影響,因為任何訓練數據的泄露都可能導致隱私和保密問題。

      法律專家表示,這可能給AI集團在版權侵權方面造成重大責任,以及對AI公司如何訓練模型和開發成本產生影響。

      律師事務所Pinsent Masons的知識產權合伙人塞瑞絲·溫·戴維斯表示,研究發現"可能對那些聲稱AI模型不存儲或復制任何版權作品的人構成挑戰"。

      AI模型是否記憶其訓練數據在最近的版權法律戰中發揮了重要作用。

      美國法院去年裁定,Anthropic在一些版權內容上訓練大語言模型可能被視為合理使用,因為它被認為具有"變革性"。

      但法院認定存儲盜版作品是"本質上、不可挽回的侵權行為",這導致該AI集團支付15億美元和解訴訟。

      在德國,去年11月的一項裁決發現OpenAI侵犯了版權,因為其模型記憶了歌詞。這起由代表作曲家、作詞家和出版商的協會GEMA提起的案件被認為是歐盟的里程碑式裁決。

      律師事務所Husch Blackwell的合伙人魯迪·特爾舍爾表示,在不越獄的情況下復制整本書"明顯是版權侵犯"。但"關鍵是這種情況是否發生得足夠頻繁,以至于[AI模型]可能對侵權承擔連帶責任,"他補充說。

      Anthropic表示,斯坦福和耶魯研究中使用的越獄技術對普通用戶不實用,提取文本所需的努力比直接購買內容更多。

      該公司還補充說,其模型不存儲特定數據集的副本,而是從訓練數據中單詞和字符串之間的模式和關系中學習。

      xAI、OpenAI和谷歌未回應置評請求。

      帝國理工學院的德·蒙喬伊表示,AI實驗室已經建立防護措施來防止訓練數據被提取,這表明他們意識到了這個問題。

      芝加哥大學計算機科學教授本·趙質疑AI實驗室是否真的需要在訓練數據中使用版權內容來創建尖端模型。

      "無論技術結果能否實現,這仍然是一個我們是否應該這樣做的問題,"趙說。"法律方面最終應該堅持立場,真正成為整個過程的仲裁者。"

      Q&A

      Q1:大語言模型的記憶現象是什么?有多嚴重?

      A:大語言模型的記憶現象是指AI模型能夠近乎逐字地復制其訓練數據中的內容。研究顯示,Gemini 2.5能夠以高度準確性復制《哈利波特與魔法石》的76.8%,Grok 3能生成70.3%。通過越獄技術,甚至能從Claude 3.7 Sonnet中提取幾乎完整的小說內容。

      Q2:AI公司之前是如何為使用版權作品訓練模型辯護的?

      A:AI公司長期聲稱模型不會記憶訓練數據,谷歌在2023年表示"模型本身不存在訓練數據的副本"。他們還聲稱使用版權書籍訓練模型屬于"合理使用",認為技術將原始作品轉化為有意義的新內容,模型是從作品中"學習"而非存儲副本。

      Q3:記憶現象對AI行業版權訴訟有什么影響?

      A:這種記憶能力削弱了AI公司的核心防御論點,可能在全球數十起版權訴訟中造成重大責任。德國法院已裁定OpenAI因模型記憶歌詞而侵犯版權,美國法院也認定存儲盜版作品是"本質上的侵權行為",導致Anthropic支付15億美元和解。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      小伙娶48歲大媽,新婚第二天大媽賴床不起,小伙掀開被子愣住了

      小伙娶48歲大媽,新婚第二天大媽賴床不起,小伙掀開被子愣住了

      一根香煙的少婦
      2026-02-23 15:00:03
      95小生人氣大洗牌,3人上桌,2人下桌,劉昊然邊緣,王一博意外

      95小生人氣大洗牌,3人上桌,2人下桌,劉昊然邊緣,王一博意外

      陳意小可愛
      2026-02-24 17:25:45
      17歲媽祖女孩口碑反轉!被扒曾帶貨,說不巡游又反悔,家人蠻橫!

      17歲媽祖女孩口碑反轉!被扒曾帶貨,說不巡游又反悔,家人蠻橫!

      古希臘掌管松餅的神
      2026-02-24 16:40:56
      今夜,集體暴漲了!

      今夜,集體暴漲了!

      中國基金報
      2026-02-25 00:17:24
      恩里克:首回合的前30分鐘就像恐怖電影,但我們展現出了韌性

      恩里克:首回合的前30分鐘就像恐怖電影,但我們展現出了韌性

      懂球帝
      2026-02-25 00:33:05
      河南省人大環境與資源保護委員會原主任委員朱長青接受紀律審查和監察調查

      河南省人大環境與資源保護委員會原主任委員朱長青接受紀律審查和監察調查

      大象新聞
      2026-02-24 15:20:02
      這種飲料正在摧毀你的胰島細胞!很多糖尿病,都和這種飲料有關!

      這種飲料正在摧毀你的胰島細胞!很多糖尿病,都和這種飲料有關!

      蜉蝣說
      2026-01-29 14:46:50
      從全球第一到業績腰斬!公牛集團被房地產拖垮,十幾億準備跑路

      從全球第一到業績腰斬!公牛集團被房地產拖垮,十幾億準備跑路

      小熊侃史
      2026-01-08 07:55:06
      聯合國沖突4周年痛批俄,軍事家評估2026年俄烏戰爭走向

      聯合國沖突4周年痛批俄,軍事家評估2026年俄烏戰爭走向

      史政先鋒
      2026-02-24 22:47:24
      湖南33歲男子放煙花被炸身亡:疑似畫面流出,家屬披露大量隱情

      湖南33歲男子放煙花被炸身亡:疑似畫面流出,家屬披露大量隱情

      博士觀察
      2026-02-24 18:14:01
      立陶宛總統通告全球,不會對中國跪下認錯,除非中方先做出讓步

      立陶宛總統通告全球,不會對中國跪下認錯,除非中方先做出讓步

      牛鍋巴小釩
      2026-02-24 19:51:00
      韓國要求俄使館撤下宣傳條幅,俄方:此為全體俄羅斯人所熟知,無意冒犯任何人

      韓國要求俄使館撤下宣傳條幅,俄方:此為全體俄羅斯人所熟知,無意冒犯任何人

      文匯報
      2026-02-24 04:20:05
      拉夫羅夫:莫斯科將把所有歷史上的俄羅斯土地歸還其合法家園

      拉夫羅夫:莫斯科將把所有歷史上的俄羅斯土地歸還其合法家園

      番茄說史聊
      2026-02-22 14:07:52
      0-4慘敗石洵瑤!大藤沙月被打崩,對我們連敗還敢囂張?

      0-4慘敗石洵瑤!大藤沙月被打崩,對我們連敗還敢囂張?

      卿子書
      2026-02-24 09:17:46
      新加坡徹底涼了:中國富豪集體撤離,資本正在用腳投票

      新加坡徹底涼了:中國富豪集體撤離,資本正在用腳投票

      流蘇晚晴
      2026-02-24 18:52:16
      外交部:中方依法依規采取措施,目的是制止日本“再軍事化”和擁核企圖,完全正當合理合法

      外交部:中方依法依規采取措施,目的是制止日本“再軍事化”和擁核企圖,完全正當合理合法

      環球網資訊
      2026-02-24 15:37:32
      65歲前TVB花旦兒子老公相繼離世三度失去至親,新年與圈中友人團年氣色佳

      65歲前TVB花旦兒子老公相繼離世三度失去至親,新年與圈中友人團年氣色佳

      TVB劇評社
      2026-02-24 13:58:48
      貝加爾湖墜車事件:活下來的江蘇爸爸,往后的每一天都是煎熬

      貝加爾湖墜車事件:活下來的江蘇爸爸,往后的每一天都是煎熬

      社會日日鮮
      2026-02-23 14:05:41
      反轉!福特放棄LG取消450億訂單,轉頭密談比亞迪?韓國巨頭懵了

      反轉!福特放棄LG取消450億訂單,轉頭密談比亞迪?韓國巨頭懵了

      大衛聊科技
      2026-02-23 13:41:26
      烏軍已收復400平方千米!俄軍仍占據優勢,但真正的戰斗不在戰場

      烏軍已收復400平方千米!俄軍仍占據優勢,但真正的戰斗不在戰場

      鷹眼Defence
      2026-02-24 18:35:09
      2026-02-25 00:48:50
      至頂頭條 incentive-icons
      至頂頭條
      記錄和推動數字化創新
      16259文章數 49691關注度
      往期回顧 全部

      科技要聞

      宇樹科技發布四足機器人Unitree As2

      頭條要聞

      男子摟住繼女強吻動作親密 當地婦聯介入

      頭條要聞

      男子摟住繼女強吻動作親密 當地婦聯介入

      體育要聞

      蘇翊鳴總結米蘭征程:我仍是那個熱愛單板滑雪的少年

      娛樂要聞

      汪小菲官宣三胎出生:承諾會照顧好3個孩子

      財經要聞

      縣城消費「限時繁榮」了十天

      汽車要聞

      入門即滿配 威蘭達AIR版上市 13.78萬元起

      態度原創

      藝術
      教育
      親子
      時尚
      公開課

      藝術要聞

      你絕對沒見過!這位藝術家的馬賽克畫讓人驚嘆不已!

      教育要聞

      馬馬馬上上岸!!!TTS《大吉大利復試手冊》+復試班:紙質筆記與1v1模擬面試堂堂上線!!

      親子要聞

      我嫁中國生了3個孩子,每天帶娃堪比春晚!

      闊腿褲失寵了?這4條褲子承包你整個春天的時髦!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版