<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      最具爭議性研究:大模型中間層輸出可 100% 反推原始輸入

      0
      分享至


      大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自AI科技評論

      作者丨鄭佳美

      編輯丨馬曉寧

      最近,一篇名為《Language Models are Injective and Hence Invertible》的論文在學(xué)術(shù)界和科技圈引起了廣泛討論,甚至連老馬的 Grok 官方也下場轉(zhuǎn)發(fā)。


      這篇論文出自意大利羅馬第一大學(xué)(Sapienza University of Rome)的GLADIA Research Lab,文中提出了一個(gè)頗有爭議卻又耐人尋味的觀點(diǎn):主流的 Transformer 語言模型在信息處理過程中幾乎不會(huì)丟失任何輸入內(nèi)容,從數(shù)學(xué)意義上看,它們是可逆的。

      換句話說,模型的隱藏狀態(tài)并不是模糊的語義壓縮,而是一種能夠完整保留輸入信息的精確重編碼。這一發(fā)現(xiàn)不僅挑戰(zhàn)了人們對語言模型“理解”機(jī)制的傳統(tǒng)認(rèn)識,也讓研究者開始思考一個(gè)更具體的問題:這種理論上的信息保持,在實(shí)際模型中是否真的存在?

      為了回答這一問題,作者設(shè)計(jì)并實(shí)施了一系列大規(guī)模實(shí)驗(yàn),試圖從實(shí)證角度驗(yàn)證 Transformer 的可逆性與單射特性。


      01

      Transformer 幾乎不會(huì)丟失信息

      這篇論文的核心實(shí)驗(yàn)結(jié)果指出:主流 Transformer 語言模型在實(shí)際應(yīng)用中幾乎總是單射的(injective),即不同的輸入文本會(huì)被映射到完全不同的隱藏狀態(tài)表示,沒有發(fā)生任何“碰撞”現(xiàn)象。


      研究者在六個(gè)主流模型(GPT-2、Gemma-3、LLaMA-3.1、Mistral、Phi-4 和 TinyStories)上進(jìn)行了超過50 億次輸入對比測試,在所有模型的各個(gè)層中都未發(fā)現(xiàn)兩條不同輸入對應(yīng)相同隱藏表示的情況,驗(yàn)證了模型在理論上所具備的單射性在實(shí)踐中同樣成立。


      此外,作者提出的SIPIT(Sequential Inverse Prompt via Iterative Updates)算法成功地從模型的隱藏狀態(tài)中以 100% 準(zhǔn)確率重建了原始輸入文本,并且在運(yùn)行效率上顯著優(yōu)于傳統(tǒng)方法。

      無論是自然語言文本還是代碼樣本,SIPIT 都能在理論保證的線性時(shí)間內(nèi)完成精確恢復(fù)。這一結(jié)果表明,Transformer 模型不僅在數(shù)學(xué)上是信息保持的系統(tǒng),在實(shí)際訓(xùn)練與推理中也確實(shí)保留了輸入的全部信息,驗(yàn)證了語言模型的可逆性與結(jié)構(gòu)性無損特征。


      02

      Transformer 的自我驗(yàn)證

      這項(xiàng)研究的實(shí)驗(yàn)經(jīng)過分為兩個(gè)主要階段:首先通過大規(guī)模實(shí)驗(yàn)驗(yàn)證 Transformer 模型在實(shí)踐中是否真的具備單射性,其次通過新的算法驗(yàn)證模型是否能夠被完全反演。整個(gè)實(shí)驗(yàn)設(shè)計(jì)嚴(yán)密、層層遞進(jìn),目的是從理論和實(shí)證兩個(gè)層面證明語言模型不會(huì)丟失輸入信息。


      在實(shí)驗(yàn)準(zhǔn)備階段,研究團(tuán)隊(duì)選擇了六種具有代表性的語言模型,包括 GPT-2、Gemma-3、LLaMA-3.1、Mistral、Phi-4-mini 和 TinyStories。這些模型涵蓋了不同規(guī)模與訓(xùn)練方式的 Transformer 架構(gòu)。

      為了保證實(shí)驗(yàn)的全面性,研究者從多個(gè)語料庫中抽取樣本數(shù)據(jù),包括 Wikipedia、C4、The Pile 以及 GitHub 上的 Python 代碼數(shù)據(jù),共計(jì)十萬條輸入樣本,內(nèi)容既包含自然語言文本,也包含編程語言代碼。所有模型均在統(tǒng)一的硬件和軟件環(huán)境下運(yùn)行,確保實(shí)驗(yàn)結(jié)果可復(fù)現(xiàn)且無外部干擾。


      實(shí)驗(yàn)的第一部分旨在檢驗(yàn)?zāi)P褪欠裾娴膶Σ煌斎氡3謪^(qū)分能力。研究者將每一條輸入依次輸入模型,提取各層中最后一個(gè) token 的隱藏狀態(tài),并計(jì)算所有樣本兩兩之間的歐氏距離。

      如果出現(xiàn)距離小于 10?? 的情況,就意味著模型把兩個(gè)不同輸入映射到了幾乎相同的表示上,即發(fā)生“碰撞”。經(jīng)過超過五十億次樣本對比,結(jié)果顯示無論模型規(guī)模或?qū)訑?shù),所有隱藏狀態(tài)之間的最小距離都遠(yuǎn)高于這一閾值,沒有出現(xiàn)任何碰撞現(xiàn)象。

      進(jìn)一步的測試中,研究者挑選出十條語義最相近的樣本,針對這些樣本生成全部可能的組合輸入,并計(jì)算了超過三千億對比樣本的結(jié)果。即便在這樣極端的條件下,模型仍未出現(xiàn)任何隱藏狀態(tài)重合的情況。

      這表明,Transformer 模型在實(shí)際運(yùn)行中確實(shí)能保持輸入信息的唯一性。


      第二部分實(shí)驗(yàn)驗(yàn)證模型是否具有可逆性,即能否從隱藏狀態(tài)恢復(fù)出原始輸入文本。研究者提出了一種名為 SIPIT 的新算法,其思想基于 Transformer 的因果結(jié)構(gòu):第 t 個(gè)隱藏狀態(tài)僅依賴前 t?1 個(gè) token 和當(dāng)前 token,因此可以從隱藏狀態(tài)逐步推理出輸入序列。

      為了驗(yàn)證算法的有效性,研究者僅將隱藏狀態(tài)作為輸入,不提供任何原始文本,讓算法從中反推出完整輸入。實(shí)驗(yàn)結(jié)果顯示,SIPIT 能在理論保證的線性時(shí)間復(fù)雜度內(nèi),以百分之百的準(zhǔn)確率恢復(fù)出所有原始輸入,并且運(yùn)行速度顯著快于傳統(tǒng)的暴力枚舉方法。

      無論是自然語言文本還是代碼數(shù)據(jù),算法都能高效、準(zhǔn)確地完成輸入重建。


      在驗(yàn)證模型結(jié)構(gòu)特性的同時(shí),研究團(tuán)隊(duì)還分析了訓(xùn)練過程對單射性的影響。他們從數(shù)學(xué)上證明,梯度下降和隨機(jī)梯度下降都是可逆的連續(xù)變換,每一次參數(shù)更新都會(huì)保持模型參數(shù)分布的絕對連續(xù)性,不會(huì)讓模型坍縮到非單射狀態(tài)。

      也就是說,Transformer 模型從初始化到訓(xùn)練完成的整個(gè)過程中,都能保持這種“信息不丟失”的特征。


      總體而言,這一系列實(shí)驗(yàn)以嚴(yán)格的理論推導(dǎo)為基礎(chǔ),通過海量數(shù)據(jù)驗(yàn)證和可逆算法的實(shí)踐檢驗(yàn),完整地證明了 Transformer 模型在結(jié)構(gòu)上和行為上都是單射的,并且能夠被完全反演。實(shí)驗(yàn)的全過程充分體現(xiàn)了這一結(jié)論的普適性與穩(wěn)健性,表明語言模型在訓(xùn)練和推理中并不會(huì)丟失任何輸入信息。

      03

      突破與質(zhì)疑并存的「可逆性」研究

      更進(jìn)一步地,這些結(jié)果不僅回答了“模型能否保持信息”的問題,也為理解 Transformer 的工作原理提供了新的視角。

      從理論上看,這項(xiàng)研究打破了人們長期以來的假設(shè) —— 語言模型在內(nèi)部會(huì)壓縮信息,只保留語義層面的抽象特征。研究團(tuán)隊(duì)證明,Transformer 實(shí)際上是一個(gè)信息保持的系統(tǒng):模型在處理輸入時(shí)并不會(huì)丟失信息,而是以不同的方式對原始內(nèi)容進(jìn)行重編碼,而非降維或壓縮。

      換句話說,模型的“理解”不是模糊的抽象,而是一種高度精確的重參數(shù)化。這為解釋 Transformer 的內(nèi)部機(jī)制提供了新的數(shù)學(xué)框架,也為研究模型的表示空間結(jié)構(gòu)和上下文依賴關(guān)系開辟了方向。

      在實(shí)踐層面,這一發(fā)現(xiàn)帶來了重要的隱私與安全啟示。由于隱藏狀態(tài)在理論上可以反推出輸入文本,模型的中間層輸出在性質(zhì)上幾乎等同于原始數(shù)據(jù)。如果這些表示被存儲、傳輸或共享,可能會(huì)導(dǎo)致用戶輸入信息被間接暴露。

      由此,開發(fā)者需要更加謹(jǐn)慎地處理模型內(nèi)部的激活值,重新審視安全接口設(shè)計(jì),并在模型壓縮或蒸餾過程中考慮可逆性帶來的潛在風(fēng)險(xiǎn)。與此同時(shí),該研究也為模型可解釋性提供了新的研究思路:通過分析隱藏層信息的重構(gòu)方式,可以更清晰地理解模型語義抽象的形成過程。

      然而,這一結(jié)論也在學(xué)術(shù)界和業(yè)界引發(fā)了討論。部分研究者指出,“可逆性”的數(shù)學(xué)證明并不意味著現(xiàn)實(shí)中的模型可以直接恢復(fù)輸入或提取訓(xùn)練數(shù)據(jù)。實(shí)際的大規(guī)模模型受到數(shù)值近似、量化誤差和隨機(jī)性等因素影響,難以實(shí)現(xiàn)嚴(yán)格意義上的單射性,不同輸入仍可能產(chǎn)生相似的內(nèi)部表示。

      因此,即使掌握了中間層激活值,也并不意味著能準(zhǔn)確還原原文或繞過安全機(jī)制。

      研究團(tuán)隊(duì)在后續(xù)說明中也強(qiáng)調(diào),他們的研究主要旨在從理論角度理解信息流動(dòng)特征,而非提供可被濫用的攻擊途徑。其核心目標(biāo)是加深對語言模型內(nèi)部機(jī)制的認(rèn)識,并提醒業(yè)界在模型開發(fā)與部署中加強(qiáng)數(shù)據(jù)安全和隱私保護(hù)。


      04

      GLADIA Research Lab 是誰

      這個(gè) 2025 年 5 月份才注冊 的神秘機(jī)構(gòu) GLADIA Research Lab 是意大利羅馬第一大學(xué)計(jì)算機(jī)科學(xué)系下的一個(gè)前沿人工智能研究團(tuán)隊(duì)。

      官方信息顯示,GLADIA Research Lab 目前共有 39 名研究人員,成員來自計(jì)算機(jī)科學(xué)、物理學(xué)、工程學(xué)和數(shù)學(xué)等多個(gè)學(xué)科。實(shí)驗(yàn)室專注于探索人工智能系統(tǒng)的結(jié)構(gòu)創(chuàng)新與高效復(fù)用,其核心研究方向涵蓋模型合并與操控、無需額外訓(xùn)練的模型拼接、多模態(tài)學(xué)習(xí),以及神經(jīng)網(wǎng)絡(luò)的重用與組合性。


      而 GLADIA Research Lab 的研究愿景,是讓人工智能模型的開發(fā)與組合變得更加高效與靈活,他們希望把“構(gòu)建一個(gè)新模型”的周期,從過去的幾個(gè)月縮短到幾秒鐘。

      這個(gè)團(tuán)隊(duì)近段時(shí)間也在國際頂級學(xué)術(shù)會(huì)議上頻頻亮相,例如在ICML 2025CVPR 2025上展示了關(guān)于模型合并與任務(wù)干擾優(yōu)化的研究成果,展現(xiàn)出他們在模型融合和生成式人工智能領(lǐng)域的創(chuàng)新實(shí)力與前沿地位。

      除了模型結(jié)構(gòu)方面的研究,GLADIA 還在探索生成模型的更廣泛應(yīng)用。他們嘗試將 AI 的能力延伸到音樂創(chuàng)作、多模態(tài)內(nèi)容生成等更具創(chuàng)造性的方向,希望推動(dòng)人工智能從“計(jì)算工具”邁向“創(chuàng)意伙伴”,在藝術(shù)與認(rèn)知交匯處開拓新的可能性。

      GPU 訓(xùn)練特惠!

      H100/H200 GPU算力按秒計(jì)費(fèi),平均節(jié)省開支30%以上!

      掃碼了解詳情?

      點(diǎn)「贊」的人都變好看了哦!

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      老同志借而不還的畫,現(xiàn)估價(jià)8800萬現(xiàn)身拍賣會(huì)這個(gè)老東西究竟是誰

      老同志借而不還的畫,現(xiàn)估價(jià)8800萬現(xiàn)身拍賣會(huì)這個(gè)老東西究竟是誰

      深度報(bào)
      2025-12-22 22:36:02
      1-0!鐵衛(wèi)處子球,曼聯(lián)復(fù)仇紐卡升英超第五,烏加特甩掉災(zāi)星帽子

      1-0!鐵衛(wèi)處子球,曼聯(lián)復(fù)仇紐卡升英超第五,烏加特甩掉災(zāi)星帽子

      釘釘陌上花開
      2025-12-27 08:00:23
      RYBAR改口:庫皮揚(yáng)斯克失守,俄系軍博的“最后防線”也塌了

      RYBAR改口:庫皮揚(yáng)斯克失守,俄系軍博的“最后防線”也塌了

      老馬拉車莫少裝
      2025-12-24 21:28:37
      央地交流,侯延波赴吉林履新

      央地交流,侯延波赴吉林履新

      吉刻新聞
      2025-12-27 12:18:02
      價(jià)格飆升,多地零售價(jià)突破10元/斤!年初一斤僅一兩元,網(wǎng)友:雞蛋都快配不上它了……

      價(jià)格飆升,多地零售價(jià)突破10元/斤!年初一斤僅一兩元,網(wǎng)友:雞蛋都快配不上它了……

      每日經(jīng)濟(jì)新聞
      2025-12-26 10:01:26
      若有一天中日開戰(zhàn),日退役少將預(yù)言三大后果,日本唯一生機(jī)曝光?

      若有一天中日開戰(zhàn),日退役少將預(yù)言三大后果,日本唯一生機(jī)曝光?

      比利
      2025-12-26 20:59:23
      緊急提醒!這款常用藥或?qū)е伦詺A向

      緊急提醒!這款常用藥或?qū)е伦詺A向

      中國新聞周刊
      2025-12-27 12:29:03
      生殖科最奇葩的事是什么?網(wǎng)友:這個(gè)科絕對是最有錢成本最低的科

      生殖科最奇葩的事是什么?網(wǎng)友:這個(gè)科絕對是最有錢成本最低的科

      帶你感受人間冷暖
      2025-12-25 00:05:19
      《獻(xiàn)血法》頒布實(shí)施至今 全國無償獻(xiàn)血累計(jì)3.08億人次 保障獻(xiàn)血者權(quán)益從多個(gè)維度持續(xù)發(fā)力

      《獻(xiàn)血法》頒布實(shí)施至今 全國無償獻(xiàn)血累計(jì)3.08億人次 保障獻(xiàn)血者權(quán)益從多個(gè)維度持續(xù)發(fā)力

      每日經(jīng)濟(jì)新聞
      2025-12-26 18:08:17
      甘肅女博士張明玉剛生完孩子,被丈夫提刀割喉,丈夫:你真臟

      甘肅女博士張明玉剛生完孩子,被丈夫提刀割喉,丈夫:你真臟

      天字號野史
      2024-11-18 23:49:45
      頂流空降深圳!有人早上開始排隊(duì)

      頂流空降深圳!有人早上開始排隊(duì)

      深圳晚報(bào)
      2025-12-26 22:19:48
      37歲闞清子閨蜜葉青探望寶寶:辟謠孩子畸形,用法律追責(zé)造謠者

      37歲闞清子閨蜜葉青探望寶寶:辟謠孩子畸形,用法律追責(zé)造謠者

      粵語經(jīng)典歌單
      2025-12-27 09:09:49
      陜北革命老區(qū)邁入“高鐵時(shí)代”

      陜北革命老區(qū)邁入“高鐵時(shí)代”

      人民網(wǎng)
      2025-12-27 09:11:15
      悲催!廣東一臺資工廠結(jié)業(yè),聲稱6月起沒有訂單,將依法支付補(bǔ)償

      悲催!廣東一臺資工廠結(jié)業(yè),聲稱6月起沒有訂單,將依法支付補(bǔ)償

      火山詩話
      2025-12-27 13:42:15
      不到24小時(shí),歐豪發(fā)三大喜訊竟暗自追隨謝霆鋒的腳步

      不到24小時(shí),歐豪發(fā)三大喜訊竟暗自追隨謝霆鋒的腳步

      手工制作阿殲
      2025-12-27 11:36:56
      不到48小時(shí),高市大反轉(zhuǎn),支持率飆升至92.4%,日本發(fā)生了什么?

      不到48小時(shí),高市大反轉(zhuǎn),支持率飆升至92.4%,日本發(fā)生了什么?

      鐵錘簡科
      2025-12-26 19:23:46
      21歲男子趁表姐熟睡欲與其發(fā)生關(guān)系未得逞,家屬賠償10萬獲諒解 一審被判三緩四

      21歲男子趁表姐熟睡欲與其發(fā)生關(guān)系未得逞,家屬賠償10萬獲諒解 一審被判三緩四

      紅星新聞
      2025-12-26 17:20:10
      醫(yī)學(xué)博士:腫瘤越來越高發(fā),我們究竟被隱瞞了什么?

      醫(yī)學(xué)博士:腫瘤越來越高發(fā),我們究竟被隱瞞了什么?

      深度報(bào)
      2025-12-21 23:01:02
      太奇葩了,中國籃協(xié)宣布重要決定,球迷怒噴,中國籃球又成為笑話

      太奇葩了,中國籃協(xié)宣布重要決定,球迷怒噴,中國籃球又成為笑話

      宗介說體育
      2025-12-27 15:42:19
      從承諾歸還搶走的土地,到提出出海權(quán),俄國時(shí)隔100年又服軟了?

      從承諾歸還搶走的土地,到提出出海權(quán),俄國時(shí)隔100年又服軟了?

      近史博覽
      2025-12-20 10:50:02
      2025-12-27 16:39:00
      大數(shù)據(jù)文摘 incentive-icons
      大數(shù)據(jù)文摘
      專注大數(shù)據(jù),每日有分享!
      6811文章數(shù) 94522關(guān)注度
      往期回顧 全部

      科技要聞

      小米也漲價(jià)了!業(yè)界稱終端再不漲明年必虧

      頭條要聞

      男子戒毒后隨領(lǐng)導(dǎo)出差被警察帶走驗(yàn)?zāi)?回家后工作沒了

      頭條要聞

      男子戒毒后隨領(lǐng)導(dǎo)出差被警察帶走驗(yàn)?zāi)?回家后工作沒了

      體育要聞

      NBA教練圈的布朗尼,花了22年證明自己

      娛樂要聞

      張昊唯逃稅涉黃風(fēng)波落幕:法院認(rèn)定朋友造謠

      財(cái)經(jīng)要聞

      注意,開始拉物價(jià)了!

      汽車要聞

      好音響比大屏更重要?車企開始“聽”用戶的

      態(tài)度原創(chuàng)

      家居
      手機(jī)
      教育
      公開課
      軍事航空

      家居要聞

      格調(diào)時(shí)尚 智慧品質(zhì)居所

      手機(jī)要聞

      吳彥祖開箱小米17 Ultra徠卡版:So cool

      教育要聞

      附加題難倒了學(xué)霸!陰影部分面積為90,求空白正方形的面積

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      英法德三國領(lǐng)導(dǎo)人通話 重申對烏支持

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 国产suv精品一区二区| 荥经县| 青久草视频| 久久96国产精品久久久| 中文字幕在线v| 亚洲国产精品无码观看久久| 欧洲码亚洲码的区别入口| 欧美精品v国产精品v日韩精品| 亚洲AV成人片在线观看| 精品久久人人妻人人做精品| 精品精品亚洲高清a毛片| 日韩经典午夜福利发布| 中文字幕少妇人妻| 在线视频不卡在线亚洲| 亚洲AV无码成人精品一区 | 国产av一区二区三区| 一本色道久久综合无码人妻| 成人无码在线视频网站| 亚洲成人第一VA| 亚洲日本91| 国产一区二区视频啪啪视频| 深夜福利在线观看视频| 在线亚洲+欧美+日本专区| 精品一区二区三区三区| 久久无码av中文出轨人妻| 夜精品a片一区二区三区无码白浆| 天堂网亚洲综合在线| 免费看欧美成人a片无码| av色欲无码人妻中文字幕| 51国精产品自偷自偷综合| 人妻丰满熟妇av无码区| 精品孕妇孕交无码专区| 无码人妻丰满熟妇区五十路百度 | 毛片久久网站小视频| 内射自拍| 91丨国产丨精品丨丝袜| 18禁裸乳无遮挡自慰免费动漫| 国产一区二区av天堂热| 苍南县| 免费无码中文字幕A级毛片| 亚洲国产精|