<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      你的輸入,LLM一字未忘:Transformer被證明“幾乎處處可逆”

      0
      分享至

        

        來源:PaperWeekly

        人們一直以為,大模型的隱藏狀態(tài)是抽象的“語(yǔ)義壓縮”。但這篇論文發(fā)現(xiàn),Transformer 并沒有丟掉任何輸入信息——它能憑隱藏狀態(tài)精確反演出你說的每一個(gè)字。

        我們一直以為,語(yǔ)言模型的隱藏狀態(tài)是對(duì)輸入的一種“壓縮”或“抽象”。在這層抽象里,模型似乎丟掉了表面信息,只保留“語(yǔ)義精華”——這就是我們所說的“理解”。

        但這篇論文顛覆了這個(gè)想法。作者發(fā)現(xiàn),在標(biāo)準(zhǔn)的 Transformer 結(jié)構(gòu)下,模型的最后一 token 隱狀態(tài)幾乎必然能唯一確定輸入序列。

        換句話說,只要你知道這個(gè)隱藏狀態(tài),就能反推出原文。而且,這個(gè)性質(zhì)不僅在隨機(jī)初始化時(shí)成立,在整個(gè)訓(xùn)練過程中也不會(huì)被破壞。

        更令人震撼的是,他們沒有停留在數(shù)學(xué)證明,而是進(jìn)一步提出了一個(gè)實(shí)際算法——SipIt(Sequential Inverse Prompt via Iterative Updates)。它不需要任何外部模型訓(xùn)練,僅憑 Transformer 的隱藏狀態(tài),就能把輸入一個(gè) token 一個(gè) token 地完整還原。

        

        ▲圖1.Prompt 到 Latent Space 的單射映射:可視化 Transformer 將輸入映射到隱空間,并通過 SIPIT 完整反演。

        

        論文標(biāo)題:

        Language Models are Injective and Hence Invertible

        論文鏈接:

        https://www.arxiv.org/pdf/2510.15511

        

        研究背景:為什么單射性如此重要?

        在 Transformer 的每一層里,我們都能看到“似乎會(huì)丟信息”的環(huán)節(jié):LayerNorm 會(huì)重標(biāo)尺度,殘差連接可能抵消特征,注意力層還會(huì)把多個(gè) token 混合成一個(gè)上下文表示。這些操作看起來都不利于可逆性。

        然而作者從另一個(gè)角度切入——解析性(real-analyticity)。他們將 Transformer 視為從離散序列到連續(xù)表示的解析映射:

        

        這里 是輸入 token 序列, 是模型參數(shù), 是最后一 token 的隱藏狀態(tài)。

        作者進(jìn)一步形式化地指出,這個(gè)映射幾乎處處是單射的:

        

        也就是說,不同輸入序列映射到相同隱藏狀態(tài)的概率為零。解析函數(shù)的零點(diǎn)集要么處處為零,要么測(cè)度為零。這意味著,只要存在一個(gè)參數(shù)配置讓兩個(gè)不同輸入產(chǎn)生不同輸出,幾乎所有參數(shù)下都不會(huì)“撞車”。

        于是作者定義了一個(gè)碰撞檢測(cè)函數(shù):

        

        只要存在某個(gè) 讓 ,那就意味著“不同輸入映射成相同隱藏態(tài)”的概率為零。

        

        ▲圖2.零測(cè)集的可視化直覺:零點(diǎn)集合只形成細(xì)線(measure zero),說明碰撞幾乎不可能發(fā)生。

        他們進(jìn)一步證明:即使經(jīng)過有限步梯度下降,這種性質(zhì)仍然保持。因?yàn)閰?shù)更新:

        

        本身也是解析函數(shù),其雅可比行列式非零,不會(huì)把空間“壓塌”。更嚴(yán)格地,他們給出了如下結(jié)論:

        也就是說,在有限步梯度下降(步長(zhǎng) )后,模型依然保持輸入到隱藏空間映射的單射性。

        這表明,Transformer 的可逆性是整個(gè)訓(xùn)練過程的結(jié)構(gòu)性特征,而非偶然現(xiàn)象。

        

        方法:SipIt如何“倒放”Transformer?

        有了理論基礎(chǔ),作者提出了一個(gè)問題:

        如果隱藏狀態(tài)真的能唯一對(duì)應(yīng)輸入,我們能否直接把原文還原回來?

        他們的答案是——可以。

        核心思路

        作者定義了函數(shù) ,其中 表示前綴序列。也就是說,每個(gè)位置的隱藏狀態(tài)由前綴和當(dāng)前 token 唯一決定。

        因此,已知隱藏狀態(tài) ,我們可以遍歷詞表 ,尋找唯一滿足 的 token。只要找到這個(gè) token,就能確定當(dāng)前位置的輸入。

        

        ▲圖3.SIPIT 反演偽代碼:逐位反演輸入的迭代流程,僅依賴隱藏狀態(tài)即可完成重建。

        SipIt 基于這個(gè)原則逐位反演輸入:從第一個(gè) token 開始,對(duì)候選詞按策略遍歷,當(dāng)匹配的隱藏狀態(tài)落入允許的 ε 鄰域(ε-ball)時(shí)即接受,并進(jìn)入下一位。

        作者在文中指出:“在實(shí)踐中,我們接受那些觀測(cè)隱藏狀態(tài)位于預(yù)測(cè)值 ε 球鄰域內(nèi)的匹配結(jié)果。” 這種基于容差的檢查方式保證了算法在有限步內(nèi)收斂并找到唯一匹配。

        當(dāng)所有位置都驗(yàn)證完畢,SipIt 即可還原出完整輸入 。理論上時(shí)間復(fù)雜度為線性,最壞情況下也不超過 步,即保持線性時(shí)間復(fù)雜度(linear-time bound)。

        SipIt 把“單射性”從一個(gè)理論命題變成可操作事實(shí)——能否被 SipIt 完整反演,就是模型是否真正保留信息的實(shí)證檢測(cè)。

        

        實(shí)驗(yàn)結(jié)果:模型真的沒丟信息嗎?

        作者在 GPT-2 Small、Gemma-3、Llama-3.1、Mistral-7B、Phi-4-mini 等多種架構(gòu)上做了驗(yàn)證。他們?yōu)槊總€(gè)模型計(jì)算不同輸入的最后一 token 表示之間的最小 距離。

        結(jié)果顯示,所有最小距離都遠(yuǎn)高于 ,說明幾乎不存在碰撞。

        

        ▲圖4.不同層間的最小距離始終高于閾值,未出現(xiàn)重疊。

        

        ▲表1.不同模型的距離分布均明顯高于碰撞閾值

        極限窮舉測(cè)試:仍未出現(xiàn)碰撞

        為避免采樣偏差,作者挑出最相似的 10 對(duì)前綴,并窮舉詞表的所有接續(xù)組合——相當(dāng)于檢索上千億條輸入。即便在這個(gè)極端測(cè)試下,隱藏狀態(tài)的最小距離依然大于 0。

        

        ▲圖5. 在極限應(yīng)激測(cè)試下,所有最小距離仍遠(yuǎn)高于零

        他們還觀察了距離隨序列長(zhǎng)度變化的趨勢(shì):短句在前幾層迅速拉開間距,長(zhǎng)句則趨于穩(wěn)定。

        

        ▲圖6.短序列距離上升更快,長(zhǎng)序列趨于穩(wěn)定

        反演實(shí)驗(yàn):SipIt 的可行性驗(yàn)證

        在 GPT-2 Small 上,作者選取 100 條提示序列,僅使用隱藏狀態(tài)進(jìn)行反演。SipIt 實(shí)現(xiàn)了 100 % token-level 精確恢復(fù),反演耗時(shí)與序列長(zhǎng)度線性增長(zhǎng)。

        

        ▲表2. SipIt 在保持 100% 精度的同時(shí)速度領(lǐng)先百倍

        

        ▲圖7.反演耗時(shí)隨層深度緩慢上升,整體呈線性增長(zhǎng)

        

        總結(jié)

        這項(xiàng)研究并未改動(dòng)模型結(jié)構(gòu),卻動(dòng)搖了我們對(duì)“隱藏表示”的長(zhǎng)期假設(shè)。Transformer 的最后一 token 隱藏狀態(tài)在解析意義上幾乎處處可逆:不同輸入有不同表示,訓(xùn)練過程不會(huì)破壞這種區(qū)分性。

        SipIt 把理論轉(zhuǎn)化為工具——在不訓(xùn)練任何外部網(wǎng)絡(luò)的前提下,僅憑隱藏狀態(tài)就能線性時(shí)間重建原文。

        從科研角度,這為解釋 LLM 內(nèi)部表征提供了堅(jiān)實(shí)起點(diǎn);從工程角度,這提醒我們:緩存隱藏狀態(tài)等價(jià)于緩存用戶輸入,隱私治理必須覆蓋這一層;從方法論角度,它展示了一種范式——先證明結(jié)構(gòu),再把結(jié)構(gòu)做成算法。

        也許我們需要重新定義“理解”與“記憶”的界限。 至少?gòu)倪@篇論文的結(jié)果看——LLM 沒有忘記你說過的每一個(gè)字。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      拳怕少壯!湖人五首發(fā)正負(fù)值感人 被火箭生力軍錘爆

      拳怕少壯!湖人五首發(fā)正負(fù)值感人 被火箭生力軍錘爆

      胖子噴球
      2025-12-26 11:51:57
      兵敗如山倒!普京一聲令下,俄羅斯連夜撤軍,“最大贏家”是他

      兵敗如山倒!普京一聲令下,俄羅斯連夜撤軍,“最大贏家”是他

      花花娛界
      2025-12-25 21:02:24
      “邪修大法”做家務(wù)就是快!一分錢不花,家里就窗明幾凈~

      “邪修大法”做家務(wù)就是快!一分錢不花,家里就窗明幾凈~

      裝修秀
      2025-12-19 11:30:03
      一個(gè)月后,中洪恐?jǐn)嘟?,洪都拉斯新總統(tǒng),中國(guó)大陸不給我們好處

      一個(gè)月后,中洪恐?jǐn)嘟?,洪都拉斯新總統(tǒng),中國(guó)大陸不給我們好處

      一口娛樂
      2025-12-26 11:14:28
      北京帶狗吃火鍋那女的估計(jì)這回得賠個(gè)傾家蕩產(chǎn)了

      北京帶狗吃火鍋那女的估計(jì)這回得賠個(gè)傾家蕩產(chǎn)了

      北京作家編劇肥豬滿圈
      2025-12-23 18:21:51
      防到亞歷山大10中2!馬刺又一21歲新星崛起,美媒:1米98版韋德

      防到亞歷山大10中2!馬刺又一21歲新星崛起,美媒:1米98版韋德

      李喜林籃球絕殺
      2025-12-26 11:18:23
      水下暗戰(zhàn)升級(jí)!中國(guó)反潛網(wǎng)讓日本“大鯨”變死魚,美軍都捏把汗

      水下暗戰(zhàn)升級(jí)!中國(guó)反潛網(wǎng)讓日本“大鯨”變死魚,美軍都捏把汗

      Hi秒懂科普
      2025-12-22 18:27:14
      陳喬恩燙羊毛卷也太美了吧!穿新中式+半身裙+羊毛卷,45歲像25歲

      陳喬恩燙羊毛卷也太美了吧!穿新中式+半身裙+羊毛卷,45歲像25歲

      鋒哥與八卦哥
      2025-12-26 12:03:51
      南博火了!前院長(zhǎng)被帶查,假后人騙補(bǔ)288萬(wàn),8800萬(wàn)文物6800元賣

      南博火了!前院長(zhǎng)被帶查,假后人騙補(bǔ)288萬(wàn),8800萬(wàn)文物6800元賣

      硯底沉香LIU
      2025-12-26 11:42:02
      不到1天,央視2次發(fā)文宣布春晚新舉措,網(wǎng)友:這次終于要聽勸了

      不到1天,央視2次發(fā)文宣布春晚新舉措,網(wǎng)友:這次終于要聽勸了

      歸史
      2025-12-26 11:12:25
      很多父母不敢承認(rèn)的事實(shí):子女不結(jié)婚生子,最大根源在父母身上

      很多父母不敢承認(rèn)的事實(shí):子女不結(jié)婚生子,最大根源在父母身上

      小馬達(dá)情感故事
      2024-06-05 18:30:02
      劉詩(shī)詩(shī)的美貌被高估了,離開了禮服高跟鞋本人個(gè)不高臉也變了很多

      劉詩(shī)詩(shī)的美貌被高估了,離開了禮服高跟鞋本人個(gè)不高臉也變了很多

      鋒哥與八卦哥
      2025-12-26 11:43:30
      最新!佛山更新一批人事任免

      最新!佛山更新一批人事任免

      南方都市報(bào)
      2025-12-26 09:06:05
      皇馬跟隊(duì):西超杯決定阿隆索命運(yùn) 阿韋羅亞成銀河戰(zhàn)艦首選

      皇馬跟隊(duì):西超杯決定阿隆索命運(yùn) 阿韋羅亞成銀河戰(zhàn)艦首選

      新英體育
      2025-12-26 10:50:03
      中國(guó)旅游團(tuán),消失在歐洲

      中國(guó)旅游團(tuán),消失在歐洲

      旅界Pro
      2025-12-25 08:33:19
      朱孝天舉報(bào)阿信所屬公司“相信音樂”:勾結(jié)黃牛炒票逃稅、海外洗錢、假唱... 并稱已配合相關(guān)部門完成調(diào)查

      朱孝天舉報(bào)阿信所屬公司“相信音樂”:勾結(jié)黃牛炒票逃稅、海外洗錢、假唱... 并稱已配合相關(guān)部門完成調(diào)查

      揚(yáng)子晚報(bào)
      2025-12-25 12:21:01
      董力阿諾家里過節(jié),餐桌緊挨屋門,過道只能走一人,6口住好擁擠

      董力阿諾家里過節(jié),餐桌緊挨屋門,過道只能走一人,6口住好擁擠

      八怪娛
      2025-12-26 10:14:31
      南博風(fēng)波升級(jí),龐叔令發(fā)聲信息量大,該慌的遠(yuǎn)不止徐胡平一人

      南博風(fēng)波升級(jí),龐叔令發(fā)聲信息量大,該慌的遠(yuǎn)不止徐胡平一人

      楠楠自語(yǔ)
      2025-12-25 16:40:49
      “人形機(jī)器人第一股”將入主!機(jī)器人ETF(159770)年內(nèi)強(qiáng)勢(shì)吸金逾80億元,規(guī)模破百億連創(chuàng)新高

      “人形機(jī)器人第一股”將入主!機(jī)器人ETF(159770)年內(nèi)強(qiáng)勢(shì)吸金逾80億元,規(guī)模破百億連創(chuàng)新高

      每日經(jīng)濟(jì)新聞
      2025-12-26 09:19:04
      1月開始福氣高照!這3生肖潛力爆發(fā),正財(cái)橫財(cái)齊聚,愿望成真

      1月開始福氣高照!這3生肖潛力爆發(fā),正財(cái)橫財(cái)齊聚,愿望成真

      毅談生肖
      2025-12-26 11:36:34
      2025-12-26 13:03:00
      人工智能學(xué)家 incentive-icons
      人工智能學(xué)家
      人工智能領(lǐng)域權(quán)威媒體
      4420文章數(shù) 37357關(guān)注度
      往期回顧 全部

      科技要聞

      收割3000億!拼多多"土辦法"熬死所有巨頭

      頭條要聞

      實(shí)探北京某寶馬汽車門店:試駕已停 店內(nèi)僅留2名銷售

      頭條要聞

      實(shí)探北京某寶馬汽車門店:試駕已停 店內(nèi)僅留2名銷售

      體育要聞

      約基奇有多喜歡馬?

      娛樂要聞

      朱孝天深夜道歉,只字未提五月天阿信

      財(cái)經(jīng)要聞

      資管江湖的人事“寒冬”

      汽車要聞

      速來!智界在上海西岸準(zhǔn)備了年末潮流盛典

      態(tài)度原創(chuàng)

      教育
      時(shí)尚
      旅游
      健康
      親子

      教育要聞

      北航保研率怎么樣?這一專業(yè)竟然成最大黑馬,普通專業(yè)排名第一!

      微胖女孩冬天怎么穿衣?看看這27套冬季穿搭LOOK,保暖又顯瘦

      旅游要聞

      德國(guó)旅行團(tuán)深度體驗(yàn)魅力新疆:“這片土地令人驚嘆”

      這些新療法,讓化療不再那么痛苦

      親子要聞

      男孩多大必須分床睡?不是3歲、不是5歲,最好別超這個(gè)年齡

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 中文字幕久久人妻| 中文字幕在线精品视频入口一区| 久久亚洲精品日本波多野结衣| 欧美AA视频| 性欧美高清| 高清精品一区二区三区| 亚洲最大成人综合网720p| 国产午夜亚洲精品久久| 88XV日韩| 一本久道久久综合无码中文| 中文字幕久久熟女蜜桃| 国产成人精品久久综合| 亚洲中文字幕系列| 沙坪坝区| 国产96在线 | 亚洲| 国产一区二区三区不卡av | 在线视频不卡在线亚洲| 黑人又粗又长又大| 临城县| 一个人在线观看免费中文www| 亚洲综合精品| 成人福利午夜A片公司| 亚洲国语无码| 精品国产亚洲一区二区三区| 在线看片免费不卡人成视频| 爱色影网| 大香蕉一区| 国产成人精品a视频一区| 性夜夜春夜夜爽夜夜免费视频 | 乌兰察布市| 九九久久精品国产| 国产高清在线精品一区| 中文国产| 亚洲熟女乱色综合亚洲| 免费看成人aa片无码视频吃奶| 91久久偷偷做嫩草影院免费看| 女生洗鸡鸡喷尿的视频无马赛克?舒坦直叫的骚货视频?亚洲着九九九视频影院 | 国产丝袜在线播放| 欧美喷白浆| 国产亚洲精品美女久久久久| 91精品91久久久久久|