網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

南加州大學(xué)解決大模型編輯難題：讓AI既能學(xué)新知識(shí)又不忘舊本領(lǐng)

2026-02-24 20:16:01　來(lái)源: 科技行者

北京舉報(bào)

分享至

這項(xiàng)由南加州大學(xué)計(jì)算機(jī)科學(xué)系團(tuán)隊(duì)完成的研究發(fā)表于2026年2月，論文編號(hào)為arXiv:2602.15823v1，為大語(yǔ)言模型的知識(shí)更新問(wèn)題提供了全新解決方案。研究團(tuán)隊(duì)開(kāi)發(fā)的CrispEdit方法，就像給AI裝上了一個(gè)精準(zhǔn)的"知識(shí)手術(shù)刀"，既能植入新知識(shí)，又不會(huì)損壞原有能力。

想象一下這樣的場(chǎng)景：你有一個(gè)博學(xué)的朋友，他對(duì)各種知識(shí)都了如指掌。突然有一天，你需要告訴他一個(gè)新的事實(shí)——比如某位明星剛剛結(jié)婚了，或者某個(gè)科學(xué)發(fā)現(xiàn)剛剛被證實(shí)。理想情況下，你希望這個(gè)朋友能記住這個(gè)新信息，但同時(shí)不要忘記他原本掌握的所有其他知識(shí)，也不要因?yàn)檫@個(gè)新信息而變得說(shuō)話(huà)不清楚或者推理能力下降。

這正是研究團(tuán)隊(duì)面臨的挑戰(zhàn)。現(xiàn)在的大語(yǔ)言模型（比如ChatGPT這樣的AI助手）就像這個(gè)博學(xué)的朋友，它們?cè)谟?xùn)練時(shí)學(xué)習(xí)了大量知識(shí)，但當(dāng)我們需要更新其中某些信息時(shí)，就會(huì)遇到麻煩。傳統(tǒng)的更新方法往往會(huì)產(chǎn)生副作用：要么新知識(shí)學(xué)不好，要么學(xué)了新知識(shí)后原本的能力就退化了，甚至開(kāi)始胡言亂語(yǔ)。

南加州大學(xué)的研究團(tuán)隊(duì)將這個(gè)問(wèn)題比作在一座復(fù)雜的城市里修路。這座"知識(shí)城市"中有無(wú)數(shù)條道路相互連接，每條道路都承載著不同的信息流動(dòng)。當(dāng)你需要修建一條新道路（添加新知識(shí)）時(shí)，你不能簡(jiǎn)單粗暴地推土重建，因?yàn)檫@會(huì)破壞整個(gè)交通網(wǎng)絡(luò)。你需要找到那些對(duì)現(xiàn)有交通影響最小的路徑來(lái)建設(shè)新道路。

研究團(tuán)隊(duì)發(fā)現(xiàn)，AI模型的知識(shí)結(jié)構(gòu)就像這座城市一樣，存在著"交通要道"和"偏僻小徑"。有些參數(shù)（可以理解為神經(jīng)網(wǎng)絡(luò)中的連接強(qiáng)度）就像城市的主干道，稍微改動(dòng)就會(huì)影響整個(gè)系統(tǒng)的運(yùn)行；而另一些參數(shù)則像偏僻的小巷，即使進(jìn)行較大改動(dòng)也不會(huì)對(duì)整體造成嚴(yán)重影響。

CrispEdit方法的核心思想就是識(shí)別出這些"偏僻小徑"——那些對(duì)模型整體能力影響較小的方向，然后專(zhuān)門(mén)在這些方向上進(jìn)行知識(shí)更新。這就像是一位經(jīng)驗(yàn)豐富的城市規(guī)劃師，能夠精確地找到那些既能滿(mǎn)足新建需求，又不會(huì)破壞現(xiàn)有交通流的最佳路線。

為了找到這些安全的更新方向，研究團(tuán)隊(duì)使用了數(shù)學(xué)中的"曲率"概念。如果把模型的能力想象成一個(gè)起伏的山地地形，那么曲率就描述了地形的陡峭程度。在陡峭的山坡上（高曲率區(qū)域），即使很小的移動(dòng)也會(huì)導(dǎo)致高度的劇烈變化，這對(duì)應(yīng)著模型能力的顯著變化。而在相對(duì)平緩的區(qū)域（低曲率區(qū)域），你可以移動(dòng)較遠(yuǎn)的距離而高度變化不大，這就對(duì)應(yīng)著那些對(duì)模型整體能力影響較小的參數(shù)方向。

CrispEdit的巧妙之處在于，它會(huì)事先繪制出這個(gè)"能力地形圖"，找出所有的平緩區(qū)域，然后將新知識(shí)的學(xué)習(xí)限制在這些區(qū)域內(nèi)進(jìn)行。這樣既保證了新知識(shí)能夠被有效學(xué)習(xí)，又最大程度地保護(hù)了模型原有的各種能力。

一、數(shù)學(xué)魔法：從復(fù)雜公式到簡(jiǎn)單直覺(jué)

研究團(tuán)隊(duì)面臨的第一個(gè)挑戰(zhàn)是如何準(zhǔn)確地測(cè)量模型參數(shù)變化對(duì)整體能力的影響。這就像需要一個(gè)精密的儀器來(lái)測(cè)量在城市某個(gè)角落修建小路對(duì)整個(gè)交通系統(tǒng)的影響程度。

傳統(tǒng)的方法需要假設(shè)模型已經(jīng)訓(xùn)練到了完美狀態(tài)，就像假設(shè)一個(gè)學(xué)生已經(jīng)把所有知識(shí)都掌握得爐火純青。但現(xiàn)實(shí)中，大型AI模型往往沒(méi)有達(dá)到這種理想狀態(tài)——它們就像還在學(xué)習(xí)過(guò)程中的學(xué)生，知識(shí)掌握得還不夠完美。這種情況下，傳統(tǒng)方法的測(cè)量就會(huì)出現(xiàn)偏差。

為了解決這個(gè)問(wèn)題，研究團(tuán)隊(duì)引入了一個(gè)叫做"Bregman散度"的數(shù)學(xué)工具。聽(tīng)起來(lái)很復(fù)雜，但其實(shí)可以用一個(gè)簡(jiǎn)單的比喻來(lái)理解：假設(shè)你要比較兩個(gè)廚師做的菜有多相似。傳統(tǒng)方法可能直接比較菜品的外觀，但Bregman散度更像是比較兩個(gè)廚師的烹飪過(guò)程——即使最終的菜品看起來(lái)略有不同，但如果烹飪過(guò)程相似，我們就認(rèn)為兩個(gè)廚師的技藝是相近的。

這種方法的好處是，即使模型還在"學(xué)習(xí)中"（沒(méi)有達(dá)到完美狀態(tài)），它也能準(zhǔn)確地測(cè)量出參數(shù)變化對(duì)能力的影響。這就像即使學(xué)生還在考試中，我們也能準(zhǔn)確判斷某個(gè)知識(shí)點(diǎn)的掌握程度對(duì)整體成績(jī)的影響。

更重要的是，這種方法得出的結(jié)果恰好具有一個(gè)理想的數(shù)學(xué)性質(zhì)：它可以表示為一個(gè)二次方程的形式。這聽(tīng)起來(lái)很學(xué)術(shù)，但實(shí)際意義是巨大的——它意味著研究團(tuán)隊(duì)可以用現(xiàn)有的高效數(shù)學(xué)工具來(lái)處理這個(gè)問(wèn)題，就像發(fā)現(xiàn)了一把正好適合這個(gè)鎖的鑰匙。

二、智能導(dǎo)航：在萬(wàn)億參數(shù)中找到安全路徑

找到了測(cè)量工具后，下一個(gè)挑戰(zhàn)是如何在模型龐大的參數(shù)空間中找到那些"安全路徑"。現(xiàn)代大語(yǔ)言模型擁有數(shù)十億甚至數(shù)千億個(gè)參數(shù)，這個(gè)數(shù)量級(jí)讓直接分析變得不可能。這就像要在一個(gè)有萬(wàn)億條道路的超級(jí)城市中規(guī)劃路線，傳統(tǒng)的地圖已經(jīng)完全無(wú)法使用。

研究團(tuán)隊(duì)的解決方案是使用一種叫做K-FAC的近似技術(shù)。可以把K-FAC想象成一種智能的地圖壓縮技術(shù)：它不是試圖繪制每一條小巷的詳細(xì)地圖，而是識(shí)別出城市的主要結(jié)構(gòu)和模式，然后用這些模式來(lái)快速估算任何路徑的影響。

具體來(lái)說(shuō)，K-FAC觀察到神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)具有某種規(guī)律性，就像城市往往按照網(wǎng)格狀布局一樣。利用這種規(guī)律性，它可以將復(fù)雜的全局分析分解為許多簡(jiǎn)單的局部分析，然后將結(jié)果巧妙地組合起來(lái)。

這種方法的效果是顯著的。原本需要存儲(chǔ)和處理萬(wàn)億級(jí)別數(shù)據(jù)的問(wèn)題，現(xiàn)在只需要處理千萬(wàn)級(jí)別的數(shù)據(jù)——相當(dāng)于將一個(gè)裝滿(mǎn)整個(gè)圖書(shū)館的問(wèn)題壓縮成了幾本詞典的大小。而且，這種壓縮幾乎不損失精度，就像用幾張關(guān)鍵的衛(wèi)星圖片就能準(zhǔn)確導(dǎo)航整個(gè)城市。

更巧妙的是，研究團(tuán)隊(duì)開(kāi)發(fā)了一種"免存儲(chǔ)"的投影技術(shù)。傳統(tǒng)方法需要先構(gòu)建完整的"安全路徑地圖"，然后再在上面標(biāo)記可行路線。但這種地圖本身就可能占用巨大的存儲(chǔ)空間。新方法則像是一個(gè)隨時(shí)計(jì)算的GPS導(dǎo)航系統(tǒng)：它不需要存儲(chǔ)完整地圖，而是在需要的時(shí)候?qū)崟r(shí)計(jì)算出最佳路徑。

這個(gè)技術(shù)的核心是利用了數(shù)學(xué)中的一個(gè)巧妙性質(zhì)：某些復(fù)雜運(yùn)算可以分解為幾個(gè)簡(jiǎn)單運(yùn)算的組合。就像復(fù)雜的烹飪過(guò)程可以分解為幾個(gè)基本步驟（切菜、調(diào)味、烹飪），研究團(tuán)隊(duì)將復(fù)雜的參數(shù)投影分解為幾個(gè)簡(jiǎn)單的數(shù)學(xué)變換，然后按順序執(zhí)行這些變換，最終得到相同的結(jié)果，但大大節(jié)省了計(jì)算和存儲(chǔ)資源。

三、漸進(jìn)式學(xué)習(xí)：讓AI像人一樣持續(xù)進(jìn)步

在解決了技術(shù)難題后，研究團(tuán)隊(duì)還考慮了一個(gè)更現(xiàn)實(shí)的問(wèn)題：在實(shí)際應(yīng)用中，我們往往不是一次性需要更新大量知識(shí)，而是需要持續(xù)不斷地學(xué)習(xí)新信息。這就像一個(gè)人的學(xué)習(xí)過(guò)程——我們不是在某一天突然獲得所有知識(shí)，而是每天都在學(xué)習(xí)新東西，同時(shí)保持之前學(xué)到的內(nèi)容。

為了模擬這種持續(xù)學(xué)習(xí)的場(chǎng)景，研究團(tuán)隊(duì)開(kāi)發(fā)了CrispEdit的序列版本。這個(gè)版本的工作方式類(lèi)似于一個(gè)經(jīng)驗(yàn)豐富的圖書(shū)管理員：每當(dāng)有新書(shū)到達(dá)時(shí)，管理員不僅要找到合適的位置放置新書(shū)，還要確保這不會(huì)影響讀者找到其他書(shū)籍的便利性。

序列版本的關(guān)鍵創(chuàng)新在于"累積式地圖更新"。還是用城市規(guī)劃的比喻：當(dāng)你修建了第一條新道路后，城市的交通模式會(huì)發(fā)生微妙變化，這種變化應(yīng)該被考慮到下一次道路修建的規(guī)劃中。CrispEdit-Seq會(huì)記錄每次知識(shí)更新對(duì)模型能力地形圖的影響，然后將這些變化累積到下一次更新的規(guī)劃中。

這種方法的好處是顯著的。在傳統(tǒng)方法中，連續(xù)的多次知識(shí)更新往往會(huì)導(dǎo)致"累積性損壞"——每次更新都會(huì)造成一點(diǎn)點(diǎn)能力損失，多次更新后損失就變得不可忽略。而CrispEdit-Seq通過(guò)精心維護(hù)能力地形圖，能夠?qū)⑦@種累積損失降到最低。

更重要的是，這種序列方法還具有很好的隱私保護(hù)特性。在某些應(yīng)用場(chǎng)景中，你可能不希望保存所有的歷史更新數(shù)據(jù)，而只想保留更新的"效果"。CrispEdit-Seq可以在不保存原始更新數(shù)據(jù)的情況下，僅通過(guò)維護(hù)少量統(tǒng)計(jì)信息來(lái)實(shí)現(xiàn)持續(xù)學(xué)習(xí)，這對(duì)于需要處理敏感信息的應(yīng)用場(chǎng)景特別重要。

四、實(shí)驗(yàn)驗(yàn)證：從玩具模型到真實(shí)世界

理論上的突破需要通過(guò)實(shí)驗(yàn)來(lái)驗(yàn)證，研究團(tuán)隊(duì)設(shè)計(jì)了從簡(jiǎn)單到復(fù)雜的一系列測(cè)試來(lái)證明CrispEdit的有效性。

他們首先在一個(gè)相對(duì)簡(jiǎn)單的場(chǎng)景中測(cè)試了基本原理：讓一個(gè)原本識(shí)別手寫(xiě)數(shù)字的模型學(xué)會(huì)識(shí)別時(shí)尚圖片。這就像讓一個(gè)原本擅長(zhǎng)識(shí)別漢字的人學(xué)會(huì)識(shí)別英文字母，既要學(xué)會(huì)新技能，又不能忘記原來(lái)的漢字識(shí)別能力。

在這個(gè)可控的環(huán)境中，研究團(tuán)隊(duì)可以精確計(jì)算出真正的"最佳更新路徑"（因?yàn)槟Ｐ妥銐蛐。梢赃M(jìn)行完整分析），然后比較不同方法找到的路徑與最佳路徑的差距。結(jié)果顯示，CrispEdit找到的路徑幾乎與理論最優(yōu)路徑重合，而其他方法的路徑則相對(duì)粗糙很多。

接下來(lái)是更具挑戰(zhàn)性的真實(shí)世界測(cè)試：在大型語(yǔ)言模型上進(jìn)行知識(shí)更新。研究團(tuán)隊(duì)選擇了當(dāng)前最先進(jìn)的模型之一——LLaMA-3-8B，這個(gè)模型擁有80億個(gè)參數(shù)，相當(dāng)于一個(gè)擁有龐大知識(shí)庫(kù)的超級(jí)專(zhuān)家。

測(cè)試內(nèi)容包括三類(lèi)典型的知識(shí)更新任務(wù)。第一類(lèi)是事實(shí)性知識(shí)更新，比如更正"某某公司的CEO是誰(shuí)"這樣的基礎(chǔ)事實(shí)。第二類(lèi)是反事實(shí)知識(shí)學(xué)習(xí)，比如讓模型學(xué)習(xí)一個(gè)虛構(gòu)的事實(shí)"如果重力方向相反會(huì)怎樣"。第三類(lèi)是大規(guī)模知識(shí)編輯，一次性更新成千上萬(wàn)條相關(guān)信息。

在每類(lèi)測(cè)試中，研究團(tuán)隊(duì)都用兩個(gè)維度來(lái)評(píng)估性能：編輯成功率（新知識(shí)學(xué)得怎么樣）和能力保持率（原有能力是否受損）。這就像評(píng)估一個(gè)學(xué)生學(xué)新課程的表現(xiàn)：既要看新課程的成績(jī)，也要看其他科目的成績(jī)是否因此下降。

結(jié)果令人印象深刻。在事實(shí)性知識(shí)更新任務(wù)中，CrispEdit達(dá)到了80.5%的編輯成功率，同時(shí)在各項(xiàng)基礎(chǔ)能力測(cè)試中的表現(xiàn)與原模型幾乎沒(méi)有差異——數(shù)學(xué)推理能力保持在76%，常識(shí)問(wèn)答保持在69.5%，指令遵循能力保持在67.9%。相比之下，其他方法要么編輯成功率很低，要么在基礎(chǔ)能力上出現(xiàn)了顯著下降。

特別值得注意的是評(píng)估方式的改進(jìn)。傳統(tǒng)的模型編輯評(píng)估往往采用"提示-回答"的方式，即給模型一個(gè)問(wèn)題，讓它選擇正確答案。但這種評(píng)估方式過(guò)于理想化，因?yàn)樗僭O(shè)模型總是在回答預(yù)設(shè)的標(biāo)準(zhǔn)問(wèn)題。研究團(tuán)隊(duì)采用了更接近實(shí)際應(yīng)用的評(píng)估方式：讓模型在開(kāi)放式對(duì)話(huà)中自然地表達(dá)更新后的知識(shí)，然后用另一個(gè)AI系統(tǒng)來(lái)判斷回答的正確性。

在這種更嚴(yán)格的評(píng)估下，許多看起來(lái)很好的傳統(tǒng)方法都暴露出了問(wèn)題：它們可能在標(biāo)準(zhǔn)測(cè)試中表現(xiàn)不錯(cuò)，但在實(shí)際對(duì)話(huà)中卻無(wú)法正確運(yùn)用更新的知識(shí)，或者出現(xiàn)了語(yǔ)言表達(dá)的問(wèn)題。而CrispEdit在這種嚴(yán)格評(píng)估下依然保持了優(yōu)秀的表現(xiàn)。

五、性能對(duì)比：站在巨人肩膀上的新突破

為了更好地理解CrispEdit的優(yōu)勢(shì)，研究團(tuán)隊(duì)將其與當(dāng)前學(xué)術(shù)界和工業(yè)界的主流方法進(jìn)行了全面比較。這些對(duì)比方法可以分為幾個(gè)主要類(lèi)別，每種都代表了不同的設(shè)計(jì)哲學(xué)。

第一類(lèi)是"定位-編輯"方法，代表性的包括MEMIT和AlphaEdit。這類(lèi)方法的思路是先找到存儲(chǔ)特定知識(shí)的神經(jīng)元位置，然后直接修改這些神經(jīng)元。這就像在圖書(shū)館中找到某本書(shū)的確切位置，然后直接替換其中的某些頁(yè)面。這種方法的優(yōu)點(diǎn)是針對(duì)性強(qiáng)，但缺點(diǎn)是可能過(guò)于局限——如果對(duì)知識(shí)存儲(chǔ)位置的判斷有誤，或者知識(shí)以分布式方式存儲(chǔ)，這種方法就可能失效。

實(shí)驗(yàn)結(jié)果顯示，MEMIT在大部分測(cè)試中幾乎完全失效，編輯成功率接近0%。這表明直接定位和修改的策略在大型現(xiàn)代模型中遇到了根本性困難。AlphaEdit表現(xiàn)要好一些，在某些任務(wù)中能達(dá)到70%左右的編輯成功率，但代價(jià)是基礎(chǔ)能力的顯著下降——數(shù)學(xué)能力從原來(lái)的73.5%下降到45.5%，常識(shí)推理從69.5%下降到52.7%。

第二類(lèi)是"約束微調(diào)"方法，包括LocBF-FT、Adam-NSCL等。這類(lèi)方法的策略是在傳統(tǒng)的梯度下降更新中加入各種約束，防止更新過(guò)程偏離得太遠(yuǎn)。這就像給汽車(chē)安裝限速器和方向盤(pán)鎖，確保它只能在安全范圍內(nèi)行駛。

Adam-NSCL的具體做法是限制更新只能發(fā)生在激活值協(xié)方差矩陣的零空間內(nèi)。聽(tīng)起來(lái)很復(fù)雜，但簡(jiǎn)單理解就是：它只允許在那些"看起來(lái)不會(huì)影響現(xiàn)有功能"的方向上進(jìn)行更新。研究團(tuán)隊(duì)的理論分析證明，這種約束實(shí)際上比CrispEdit的約束更加嚴(yán)格——相當(dāng)于只能在更窄的"安全通道"中行駛。實(shí)驗(yàn)結(jié)果也驗(yàn)證了這一點(diǎn)：Adam-NSCL的編輯成功率只有16.6%，遠(yuǎn)低于CrispEdit的80.5%。

LocBF-FT采用了另一種約束策略：它只更新模型中的某一個(gè)特定層，通過(guò)限制更新范圍來(lái)減少副作用。這種方法在小規(guī)模編輯時(shí)表現(xiàn)不錯(cuò)，但當(dāng)編輯規(guī)模擴(kuò)大到1萬(wàn)條時(shí)，性能就急劇下降，編輯成功率從69.5%掉到53.5%。這說(shuō)明單層更新的容量限制成為了瓶頸。

第三類(lèi)是通用的參數(shù)高效方法，如LoRA（低秩適應(yīng)）。這類(lèi)方法原本是為了解決大模型微調(diào)的計(jì)算成本問(wèn)題而設(shè)計(jì)的，它們通過(guò)只更新一小部分參數(shù)來(lái)實(shí)現(xiàn)模型適應(yīng)。在知識(shí)編輯場(chǎng)景中，這類(lèi)方法表現(xiàn)一般，主要問(wèn)題是缺乏針對(duì)性的能力保護(hù)機(jī)制。

最有趣的對(duì)比是與傳統(tǒng)的全量微調(diào)（FT）。全量微調(diào)就是不加任何約束地直接用新數(shù)據(jù)訓(xùn)練模型，這是最簡(jiǎn)單直接的方法。單次微調(diào)時(shí)，它能達(dá)到46.8%的編輯成功率，但基礎(chǔ)能力會(huì)有一定下降。更嚴(yán)重的問(wèn)題出現(xiàn)在序列編輯中：連續(xù)進(jìn)行多輪微調(diào)后，模型的表現(xiàn)急劇惡化，最終編輯成功率降到3.6%，多項(xiàng)基礎(chǔ)能力也大幅下降。

相比之下，CrispEdit不僅在單次編輯中表現(xiàn)優(yōu)秀，在序列編輯中也保持了穩(wěn)定性。經(jīng)過(guò)多輪編輯后，其成功率雖然有所下降（從80.5%降到71.1%），但依然遠(yuǎn)高于其他方法，基礎(chǔ)能力的保持也相對(duì)較好。

六、深入分析：為什么CrispEdit如此有效

為了理解CrispEdit成功的深層原因，研究團(tuán)隊(duì)進(jìn)行了一系列分析實(shí)驗(yàn)，就像醫(yī)生要了解藥物的作用機(jī)理一樣。

首先他們測(cè)試了能力數(shù)據(jù)集大小的影響。回憶一下，CrispEdit需要用一個(gè)"能力數(shù)據(jù)集"來(lái)繪制模型的能力地形圖。一個(gè)自然的問(wèn)題是：這個(gè)數(shù)據(jù)集需要多大才夠用？

令人驚訝的是，實(shí)驗(yàn)顯示CrispEdit對(duì)能力數(shù)據(jù)集的大小相當(dāng)不敏感。即使只用100個(gè)樣本，它也能保持基礎(chǔ)能力在可接受的范圍內(nèi)；用1000個(gè)樣本時(shí)，性能就已經(jīng)接近用10萬(wàn)個(gè)樣本的效果。這個(gè)發(fā)現(xiàn)很重要，因?yàn)樗馕吨趯?shí)際應(yīng)用中，我們不需要準(zhǔn)備龐大的能力數(shù)據(jù)集就能享受CrispEdit的好處。

但是，當(dāng)研究團(tuán)隊(duì)完全移除投影約束（相當(dāng)于移除安全導(dǎo)航系統(tǒng)）時(shí)，模型的能力保持就出現(xiàn)了嚴(yán)重問(wèn)題。這證明了約束機(jī)制確實(shí)是必需的，而不是可有可無(wú)的裝飾。

接下來(lái)他們測(cè)試了能量閾值γ的敏感性。這個(gè)參數(shù)控制了"安全通道"的寬窄——γ越大，允許的更新范圍越小，安全性越高但編輯能力可能受限；γ越小則相反。

實(shí)驗(yàn)顯示，CrispEdit在相當(dāng)寬的γ范圍內(nèi)（0.5到0.99）都能保持良好性能，這表明用戶(hù)不需要精心調(diào)節(jié)這個(gè)參數(shù)就能獲得好的效果。不過(guò)，針對(duì)不同類(lèi)型的編輯任務(wù)，確實(shí)存在一個(gè)相對(duì)最優(yōu)的γ值：事實(shí)性編輯適合用0.7，而更復(fù)雜的知識(shí)更新則適合用0.9。

規(guī)模擴(kuò)展性的測(cè)試也很重要。當(dāng)編輯任務(wù)從3000條擴(kuò)展到1萬(wàn)條時(shí)，大部分基線方法都出現(xiàn)了性能下降。特別是AlphaEdit，其編輯成功率從74.9%急劇下降到0.3%，這表明其方法存在嚴(yán)重的擴(kuò)展性問(wèn)題。而CrispEdit的性能下降相對(duì)平緩，從79.4%下降到77.4%，依然保持在可用范圍內(nèi)。

研究團(tuán)隊(duì)還在不同的模型架構(gòu)上測(cè)試了CrispEdit的通用性。除了LLaMA-3-8B，他們還在Qwen-2.5-1.5B上進(jìn)行了實(shí)驗(yàn)。盡管這兩個(gè)模型的架構(gòu)和訓(xùn)練數(shù)據(jù)都有顯著差異，CrispEdit依然表現(xiàn)出了一致的優(yōu)勢(shì)，這說(shuō)明其方法具有良好的通用性。

特別有趣的是一個(gè)實(shí)現(xiàn)細(xì)節(jié)的發(fā)現(xiàn)。在序列編輯的K-FAC計(jì)算中，研究團(tuán)隊(duì)發(fā)現(xiàn)如果嚴(yán)格按照微調(diào)設(shè)置（只計(jì)算目標(biāo)token的損失）來(lái)計(jì)算統(tǒng)計(jì)量，效果反而不如計(jì)算完整序列的統(tǒng)計(jì)量。這個(gè)發(fā)現(xiàn)提醒我們，理論上看似合理的做法在實(shí)踐中可能需要調(diào)整。

七、實(shí)際應(yīng)用：從實(shí)驗(yàn)室走向現(xiàn)實(shí)世界

除了在標(biāo)準(zhǔn)benchmark上的表現(xiàn)，研究團(tuán)隊(duì)還展示了CrispEdit在更接近實(shí)際應(yīng)用場(chǎng)景中的表現(xiàn)。他們?cè)O(shè)計(jì)了一些定性的案例研究，讓我們能夠直觀地看到不同方法的效果差異。

考慮這樣一個(gè)例子：需要更新"Marina Rebeka的聲音類(lèi)型是什么？"這個(gè)問(wèn)題的答案為"mezzo-soprano"（女中音）。在理想情況下，更新后的模型應(yīng)該能流暢自然地回答這個(gè)問(wèn)題，就像一個(gè)真正了解這個(gè)信息的人一樣。

但實(shí)驗(yàn)結(jié)果顯示，許多方法都出現(xiàn)了各種奇怪的問(wèn)題。Adam-NSCL生成的回答是"mezzo-srano-srano-srano..."，不停地重復(fù)錯(cuò)誤的詞匯；傳統(tǒng)微調(diào)方法也出現(xiàn)了類(lèi)似的重復(fù)問(wèn)題；LocBF-FT的回答是"mezzo-oprano"，雖然接近但不準(zhǔn)確；只有AlphaEdit和CrispEdit生成了正確且自然的回答。

這種現(xiàn)象揭示了一個(gè)重要問(wèn)題：在評(píng)估知識(shí)編輯效果時(shí)，不能僅僅看模型是否"知道"正確答案，還要看它能否自然流暢地表達(dá)這個(gè)答案。許多方法雖然在技術(shù)指標(biāo)上看起來(lái)不錯(cuò)，但在實(shí)際使用中會(huì)產(chǎn)生各種語(yǔ)言表達(dá)問(wèn)題。

另一個(gè)案例涉及更復(fù)雜的知識(shí)："Cebu flowerpecker的狀態(tài)是什么？"答案是"endangered species"（瀕危物種）。這個(gè)例子更具挑戰(zhàn)性，因?yàn)樗婕暗较鄬?duì)罕見(jiàn)的知識(shí)，而且答案是一個(gè)專(zhuān)業(yè)術(shù)語(yǔ)。

在這個(gè)案例中，問(wèn)題更加突出。Adam-NSCL不僅給出了正確答案，還開(kāi)始無(wú)休止地重復(fù)"endangered species Data Deficient species endangered species..."；傳統(tǒng)微調(diào)也出現(xiàn)了嚴(yán)重的重復(fù)問(wèn)題；UltraEdit的回答是"critically endangered species"，語(yǔ)義上接近但技術(shù)上不準(zhǔn)確；只有LocBF-FT和CrispEdit給出了簡(jiǎn)潔正確的回答。

這些案例研究揭示了一個(gè)關(guān)鍵洞察：知識(shí)編輯不僅僅是一個(gè)"知識(shí)存儲(chǔ)"問(wèn)題，更是一個(gè)"知識(shí)表達(dá)"問(wèn)題。一個(gè)好的編輯方法不僅要確保模型學(xué)會(huì)新知識(shí)，還要確保它能夠在適當(dāng)?shù)恼Z(yǔ)境中自然地運(yùn)用這些知識(shí)，同時(shí)保持正常的語(yǔ)言表達(dá)能力。

從計(jì)算效率的角度來(lái)看，CrispEdit也表現(xiàn)優(yōu)秀。在編輯3000條記錄的任務(wù)中，CrispEdit只需要4分6秒，相比之下MEMIT需要9小時(shí)27分鐘，AlphaEdit需要7小時(shí)19分鐘。這種效率優(yōu)勢(shì)主要來(lái)自于其設(shè)計(jì)的簡(jiǎn)潔性：CrispEdit本質(zhì)上就是在標(biāo)準(zhǔn)梯度下降的基礎(chǔ)上加上了投影約束，沒(méi)有引入復(fù)雜的額外計(jì)算。

更重要的是，CrispEdit的K-FAC統(tǒng)計(jì)量可以預(yù)先計(jì)算并重復(fù)使用。這意味著在實(shí)際部署中，系統(tǒng)可以離線計(jì)算好能力保護(hù)所需的統(tǒng)計(jì)信息，然后在需要進(jìn)行知識(shí)更新時(shí)快速應(yīng)用。這種設(shè)計(jì)使得CrispEdit特別適合那些需要頻繁更新知識(shí)的實(shí)際應(yīng)用場(chǎng)景。

八、理論貢獻(xiàn)：建立新的理解框架

除了實(shí)際的性能提升，CrispEdit的研究還為我們理解知識(shí)編輯問(wèn)題提供了新的理論框架。這個(gè)框架的核心是將知識(shí)編輯視為一個(gè)約束優(yōu)化問(wèn)題，而不是傳統(tǒng)的無(wú)約束優(yōu)化或啟發(fā)式方法。

傳統(tǒng)的知識(shí)編輯方法往往基于各種啟發(fā)式假設(shè)，比如"知識(shí)存儲(chǔ)在特定位置"或"應(yīng)該限制在某些表示空間內(nèi)更新"。這些假設(shè)雖然直觀，但缺乏堅(jiān)實(shí)的理論基礎(chǔ)，也難以在不同場(chǎng)景下保持一致的效果。

CrispEdit提出的框架則更加根本：它直接從"保持能力不變"這個(gè)核心需求出發(fā)，通過(guò)數(shù)學(xué)優(yōu)化的方法自動(dòng)找到滿(mǎn)足約束的更新方向。這種方法的優(yōu)勢(shì)在于，它不需要對(duì)知識(shí)在模型中的存儲(chǔ)方式做任何假設(shè)，而是讓數(shù)據(jù)和優(yōu)化過(guò)程自己告訴我們什么樣的更新是安全的。

這個(gè)理論框架還統(tǒng)一了許多看似不同的現(xiàn)有方法。研究團(tuán)隊(duì)證明，像AlphaEdit這樣的方法實(shí)際上可以看作是CrispEdit的一個(gè)特殊（且更受限）的情況。這種統(tǒng)一理解有助于我們更好地分析不同方法的優(yōu)劣，也為未來(lái)的研究提供了清晰的發(fā)展方向。

Bregman散度的引入也具有重要的理論意義。傳統(tǒng)的二階方法通常需要假設(shè)模型已經(jīng)收斂到局部最優(yōu)點(diǎn)，這在實(shí)際的大規(guī)模模型訓(xùn)練中很少能滿(mǎn)足。Bregman散度框架避免了這個(gè)限制，使得二階優(yōu)化方法能夠應(yīng)用到更現(xiàn)實(shí)的場(chǎng)景中。

更深層次地說(shuō)，這項(xiàng)研究揭示了一個(gè)重要的設(shè)計(jì)原則：在復(fù)雜系統(tǒng)中進(jìn)行局部修改時(shí)，應(yīng)該優(yōu)先選擇那些對(duì)全局行為影響最小的修改方向。這個(gè)原則不僅適用于神經(jīng)網(wǎng)絡(luò)，也可能對(duì)其他需要在線更新的復(fù)雜系統(tǒng)有指導(dǎo)意義。

說(shuō)到底，CrispEdit的成功證明了一個(gè)簡(jiǎn)單但深刻的道理：有時(shí)候，解決復(fù)雜問(wèn)題的最好方法不是發(fā)明全新的復(fù)雜技術(shù)，而是將問(wèn)題重新表述，然后應(yīng)用已有的成熟工具以全新的方式來(lái)解決它。通過(guò)將知識(shí)編輯重新表述為約束優(yōu)化問(wèn)題，研究團(tuán)隊(duì)得以利用數(shù)學(xué)優(yōu)化和二階方法的強(qiáng)大工具，創(chuàng)造出了一個(gè)既簡(jiǎn)潔又有效的解決方案。

這項(xiàng)研究為大語(yǔ)言模型的實(shí)用化邁出了重要一步。在AI助手日益普及的今天，如何讓這些系統(tǒng)能夠安全、高效地學(xué)習(xí)新知識(shí)，同時(shí)保持原有的可靠性，是一個(gè)至關(guān)重要的技術(shù)挑戰(zhàn)。CrispEdit提供的不僅是一個(gè)具體的技術(shù)解決方案，更是一個(gè)全新的思考框架，相信這會(huì)啟發(fā)更多后續(xù)研究，最終讓AI系統(tǒng)變得更加智能和可靠。對(duì)于那些希望深入了解這項(xiàng)技術(shù)細(xì)節(jié)的讀者，可以通過(guò)論文編號(hào)arXiv:2602.15823v1查找完整的技術(shù)文檔。

Q&A

Q1：CrispEdit方法與傳統(tǒng)的大模型知識(shí)更新方法有什么區(qū)別？

A：傳統(tǒng)方法通常采用直接修改或無(wú)約束微調(diào)的方式，容易造成模型原有能力的損失。CrispEdit則像一個(gè)精準(zhǔn)的"知識(shí)手術(shù)刀"，它會(huì)先分析模型的參數(shù)空間，找到那些對(duì)整體能力影響最小的"安全路徑"，然后只在這些路徑上進(jìn)行知識(shí)更新。這樣既能學(xué)會(huì)新知識(shí)，又能最大程度保護(hù)原有的各種能力。

Q2：為什么CrispEdit能在大型語(yǔ)言模型上高效運(yùn)行？

A：CrispEdit的效率來(lái)自?xún)蓚€(gè)關(guān)鍵技術(shù)：一是使用K-FAC技術(shù)將復(fù)雜的全局分析分解為許多簡(jiǎn)單的局部分析，大大降低了計(jì)算復(fù)雜度；二是開(kāi)發(fā)了"免存儲(chǔ)"的投影技術(shù)，不需要構(gòu)建完整的參數(shù)地圖，而是實(shí)時(shí)計(jì)算最佳更新路徑。這使得原本需要萬(wàn)億級(jí)計(jì)算的問(wèn)題壓縮到千萬(wàn)級(jí)，同時(shí)保持高精度。

Q3：CrispEdit適用于哪些實(shí)際應(yīng)用場(chǎng)景？

A：CrispEdit特別適合需要頻繁更新知識(shí)的AI應(yīng)用，比如需要及時(shí)更新時(shí)事信息的智能問(wèn)答系統(tǒng)、需要學(xué)習(xí)新產(chǎn)品信息的客服機(jī)器人、或者需要糾正錯(cuò)誤信息的教育AI助手。它既支持一次性大批量更新，也支持持續(xù)的漸進(jìn)式學(xué)習(xí)，而且能夠預(yù)先計(jì)算保護(hù)機(jī)制，在實(shí)際部署中快速應(yīng)用。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.