![]()
這項(xiàng)由南加州大學(xué)計(jì)算機(jī)科學(xué)系團(tuán)隊(duì)完成的研究發(fā)表于2026年2月,論文編號(hào)為arXiv:2602.15823v1,為大語(yǔ)言模型的知識(shí)更新問(wèn)題提供了全新解決方案。研究團(tuán)隊(duì)開(kāi)發(fā)的CrispEdit方法,就像給AI裝上了一個(gè)精準(zhǔn)的"知識(shí)手術(shù)刀",既能植入新知識(shí),又不會(huì)損壞原有能力。
想象一下這樣的場(chǎng)景:你有一個(gè)博學(xué)的朋友,他對(duì)各種知識(shí)都了如指掌。突然有一天,你需要告訴他一個(gè)新的事實(shí)——比如某位明星剛剛結(jié)婚了,或者某個(gè)科學(xué)發(fā)現(xiàn)剛剛被證實(shí)。理想情況下,你希望這個(gè)朋友能記住這個(gè)新信息,但同時(shí)不要忘記他原本掌握的所有其他知識(shí),也不要因?yàn)檫@個(gè)新信息而變得說(shuō)話(huà)不清楚或者推理能力下降。
這正是研究團(tuán)隊(duì)面臨的挑戰(zhàn)。現(xiàn)在的大語(yǔ)言模型(比如ChatGPT這樣的AI助手)就像這個(gè)博學(xué)的朋友,它們?cè)谟?xùn)練時(shí)學(xué)習(xí)了大量知識(shí),但當(dāng)我們需要更新其中某些信息時(shí),就會(huì)遇到麻煩。傳統(tǒng)的更新方法往往會(huì)產(chǎn)生副作用:要么新知識(shí)學(xué)不好,要么學(xué)了新知識(shí)后原本的能力就退化了,甚至開(kāi)始胡言亂語(yǔ)。
南加州大學(xué)的研究團(tuán)隊(duì)將這個(gè)問(wèn)題比作在一座復(fù)雜的城市里修路。這座"知識(shí)城市"中有無(wú)數(shù)條道路相互連接,每條道路都承載著不同的信息流動(dòng)。當(dāng)你需要修建一條新道路(添加新知識(shí))時(shí),你不能簡(jiǎn)單粗暴地推土重建,因?yàn)檫@會(huì)破壞整個(gè)交通網(wǎng)絡(luò)。你需要找到那些對(duì)現(xiàn)有交通影響最小的路徑來(lái)建設(shè)新道路。
研究團(tuán)隊(duì)發(fā)現(xiàn),AI模型的知識(shí)結(jié)構(gòu)就像這座城市一樣,存在著"交通要道"和"偏僻小徑"。有些參數(shù)(可以理解為神經(jīng)網(wǎng)絡(luò)中的連接強(qiáng)度)就像城市的主干道,稍微改動(dòng)就會(huì)影響整個(gè)系統(tǒng)的運(yùn)行;而另一些參數(shù)則像偏僻的小巷,即使進(jìn)行較大改動(dòng)也不會(huì)對(duì)整體造成嚴(yán)重影響。
CrispEdit方法的核心思想就是識(shí)別出這些"偏僻小徑"——那些對(duì)模型整體能力影響較小的方向,然后專(zhuān)門(mén)在這些方向上進(jìn)行知識(shí)更新。這就像是一位經(jīng)驗(yàn)豐富的城市規(guī)劃師,能夠精確地找到那些既能滿(mǎn)足新建需求,又不會(huì)破壞現(xiàn)有交通流的最佳路線。
為了找到這些安全的更新方向,研究團(tuán)隊(duì)使用了數(shù)學(xué)中的"曲率"概念。如果把模型的能力想象成一個(gè)起伏的山地地形,那么曲率就描述了地形的陡峭程度。在陡峭的山坡上(高曲率區(qū)域),即使很小的移動(dòng)也會(huì)導(dǎo)致高度的劇烈變化,這對(duì)應(yīng)著模型能力的顯著變化。而在相對(duì)平緩的區(qū)域(低曲率區(qū)域),你可以移動(dòng)較遠(yuǎn)的距離而高度變化不大,這就對(duì)應(yīng)著那些對(duì)模型整體能力影響較小的參數(shù)方向。
CrispEdit的巧妙之處在于,它會(huì)事先繪制出這個(gè)"能力地形圖",找出所有的平緩區(qū)域,然后將新知識(shí)的學(xué)習(xí)限制在這些區(qū)域內(nèi)進(jìn)行。這樣既保證了新知識(shí)能夠被有效學(xué)習(xí),又最大程度地保護(hù)了模型原有的各種能力。
一、數(shù)學(xué)魔法:從復(fù)雜公式到簡(jiǎn)單直覺(jué)
研究團(tuán)隊(duì)面臨的第一個(gè)挑戰(zhàn)是如何準(zhǔn)確地測(cè)量模型參數(shù)變化對(duì)整體能力的影響。這就像需要一個(gè)精密的儀器來(lái)測(cè)量在城市某個(gè)角落修建小路對(duì)整個(gè)交通系統(tǒng)的影響程度。
傳統(tǒng)的方法需要假設(shè)模型已經(jīng)訓(xùn)練到了完美狀態(tài),就像假設(shè)一個(gè)學(xué)生已經(jīng)把所有知識(shí)都掌握得爐火純青。但現(xiàn)實(shí)中,大型AI模型往往沒(méi)有達(dá)到這種理想狀態(tài)——它們就像還在學(xué)習(xí)過(guò)程中的學(xué)生,知識(shí)掌握得還不夠完美。這種情況下,傳統(tǒng)方法的測(cè)量就會(huì)出現(xiàn)偏差。
為了解決這個(gè)問(wèn)題,研究團(tuán)隊(duì)引入了一個(gè)叫做"Bregman散度"的數(shù)學(xué)工具。聽(tīng)起來(lái)很復(fù)雜,但其實(shí)可以用一個(gè)簡(jiǎn)單的比喻來(lái)理解:假設(shè)你要比較兩個(gè)廚師做的菜有多相似。傳統(tǒng)方法可能直接比較菜品的外觀,但Bregman散度更像是比較兩個(gè)廚師的烹飪過(guò)程——即使最終的菜品看起來(lái)略有不同,但如果烹飪過(guò)程相似,我們就認(rèn)為兩個(gè)廚師的技藝是相近的。
這種方法的好處是,即使模型還在"學(xué)習(xí)中"(沒(méi)有達(dá)到完美狀態(tài)),它也能準(zhǔn)確地測(cè)量出參數(shù)變化對(duì)能力的影響。這就像即使學(xué)生還在考試中,我們也能準(zhǔn)確判斷某個(gè)知識(shí)點(diǎn)的掌握程度對(duì)整體成績(jī)的影響。
更重要的是,這種方法得出的結(jié)果恰好具有一個(gè)理想的數(shù)學(xué)性質(zhì):它可以表示為一個(gè)二次方程的形式。這聽(tīng)起來(lái)很學(xué)術(shù),但實(shí)際意義是巨大的——它意味著研究團(tuán)隊(duì)可以用現(xiàn)有的高效數(shù)學(xué)工具來(lái)處理這個(gè)問(wèn)題,就像發(fā)現(xiàn)了一把正好適合這個(gè)鎖的鑰匙。
二、智能導(dǎo)航:在萬(wàn)億參數(shù)中找到安全路徑
找到了測(cè)量工具后,下一個(gè)挑戰(zhàn)是如何在模型龐大的參數(shù)空間中找到那些"安全路徑"。現(xiàn)代大語(yǔ)言模型擁有數(shù)十億甚至數(shù)千億個(gè)參數(shù),這個(gè)數(shù)量級(jí)讓直接分析變得不可能。這就像要在一個(gè)有萬(wàn)億條道路的超級(jí)城市中規(guī)劃路線,傳統(tǒng)的地圖已經(jīng)完全無(wú)法使用。
研究團(tuán)隊(duì)的解決方案是使用一種叫做K-FAC的近似技術(shù)。可以把K-FAC想象成一種智能的地圖壓縮技術(shù):它不是試圖繪制每一條小巷的詳細(xì)地圖,而是識(shí)別出城市的主要結(jié)構(gòu)和模式,然后用這些模式來(lái)快速估算任何路徑的影響。
具體來(lái)說(shuō),K-FAC觀察到神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)具有某種規(guī)律性,就像城市往往按照網(wǎng)格狀布局一樣。利用這種規(guī)律性,它可以將復(fù)雜的全局分析分解為許多簡(jiǎn)單的局部分析,然后將結(jié)果巧妙地組合起來(lái)。
這種方法的效果是顯著的。原本需要存儲(chǔ)和處理萬(wàn)億級(jí)別數(shù)據(jù)的問(wèn)題,現(xiàn)在只需要處理千萬(wàn)級(jí)別的數(shù)據(jù)——相當(dāng)于將一個(gè)裝滿(mǎn)整個(gè)圖書(shū)館的問(wèn)題壓縮成了幾本詞典的大小。而且,這種壓縮幾乎不損失精度,就像用幾張關(guān)鍵的衛(wèi)星圖片就能準(zhǔn)確導(dǎo)航整個(gè)城市。
更巧妙的是,研究團(tuán)隊(duì)開(kāi)發(fā)了一種"免存儲(chǔ)"的投影技術(shù)。傳統(tǒng)方法需要先構(gòu)建完整的"安全路徑地圖",然后再在上面標(biāo)記可行路線。但這種地圖本身就可能占用巨大的存儲(chǔ)空間。新方法則像是一個(gè)隨時(shí)計(jì)算的GPS導(dǎo)航系統(tǒng):它不需要存儲(chǔ)完整地圖,而是在需要的時(shí)候?qū)崟r(shí)計(jì)算出最佳路徑。
這個(gè)技術(shù)的核心是利用了數(shù)學(xué)中的一個(gè)巧妙性質(zhì):某些復(fù)雜運(yùn)算可以分解為幾個(gè)簡(jiǎn)單運(yùn)算的組合。就像復(fù)雜的烹飪過(guò)程可以分解為幾個(gè)基本步驟(切菜、調(diào)味、烹飪),研究團(tuán)隊(duì)將復(fù)雜的參數(shù)投影分解為幾個(gè)簡(jiǎn)單的數(shù)學(xué)變換,然后按順序執(zhí)行這些變換,最終得到相同的結(jié)果,但大大節(jié)省了計(jì)算和存儲(chǔ)資源。
三、漸進(jìn)式學(xué)習(xí):讓AI像人一樣持續(xù)進(jìn)步
在解決了技術(shù)難題后,研究團(tuán)隊(duì)還考慮了一個(gè)更現(xiàn)實(shí)的問(wèn)題:在實(shí)際應(yīng)用中,我們往往不是一次性需要更新大量知識(shí),而是需要持續(xù)不斷地學(xué)習(xí)新信息。這就像一個(gè)人的學(xué)習(xí)過(guò)程——我們不是在某一天突然獲得所有知識(shí),而是每天都在學(xué)習(xí)新東西,同時(shí)保持之前學(xué)到的內(nèi)容。
為了模擬這種持續(xù)學(xué)習(xí)的場(chǎng)景,研究團(tuán)隊(duì)開(kāi)發(fā)了CrispEdit的序列版本。這個(gè)版本的工作方式類(lèi)似于一個(gè)經(jīng)驗(yàn)豐富的圖書(shū)管理員:每當(dāng)有新書(shū)到達(dá)時(shí),管理員不僅要找到合適的位置放置新書(shū),還要確保這不會(huì)影響讀者找到其他書(shū)籍的便利性。
序列版本的關(guān)鍵創(chuàng)新在于"累積式地圖更新"。還是用城市規(guī)劃的比喻:當(dāng)你修建了第一條新道路后,城市的交通模式會(huì)發(fā)生微妙變化,這種變化應(yīng)該被考慮到下一次道路修建的規(guī)劃中。CrispEdit-Seq會(huì)記錄每次知識(shí)更新對(duì)模型能力地形圖的影響,然后將這些變化累積到下一次更新的規(guī)劃中。
這種方法的好處是顯著的。在傳統(tǒng)方法中,連續(xù)的多次知識(shí)更新往往會(huì)導(dǎo)致"累積性損壞"——每次更新都會(huì)造成一點(diǎn)點(diǎn)能力損失,多次更新后損失就變得不可忽略。而CrispEdit-Seq通過(guò)精心維護(hù)能力地形圖,能夠?qū)⑦@種累積損失降到最低。
更重要的是,這種序列方法還具有很好的隱私保護(hù)特性。在某些應(yīng)用場(chǎng)景中,你可能不希望保存所有的歷史更新數(shù)據(jù),而只想保留更新的"效果"。CrispEdit-Seq可以在不保存原始更新數(shù)據(jù)的情況下,僅通過(guò)維護(hù)少量統(tǒng)計(jì)信息來(lái)實(shí)現(xiàn)持續(xù)學(xué)習(xí),這對(duì)于需要處理敏感信息的應(yīng)用場(chǎng)景特別重要。
四、實(shí)驗(yàn)驗(yàn)證:從玩具模型到真實(shí)世界
理論上的突破需要通過(guò)實(shí)驗(yàn)來(lái)驗(yàn)證,研究團(tuán)隊(duì)設(shè)計(jì)了從簡(jiǎn)單到復(fù)雜的一系列測(cè)試來(lái)證明CrispEdit的有效性。
他們首先在一個(gè)相對(duì)簡(jiǎn)單的場(chǎng)景中測(cè)試了基本原理:讓一個(gè)原本識(shí)別手寫(xiě)數(shù)字的模型學(xué)會(huì)識(shí)別時(shí)尚圖片。這就像讓一個(gè)原本擅長(zhǎng)識(shí)別漢字的人學(xué)會(huì)識(shí)別英文字母,既要學(xué)會(huì)新技能,又不能忘記原來(lái)的漢字識(shí)別能力。
在這個(gè)可控的環(huán)境中,研究團(tuán)隊(duì)可以精確計(jì)算出真正的"最佳更新路徑"(因?yàn)槟P妥銐蛐。梢赃M(jìn)行完整分析),然后比較不同方法找到的路徑與最佳路徑的差距。結(jié)果顯示,CrispEdit找到的路徑幾乎與理論最優(yōu)路徑重合,而其他方法的路徑則相對(duì)粗糙很多。
接下來(lái)是更具挑戰(zhàn)性的真實(shí)世界測(cè)試:在大型語(yǔ)言模型上進(jìn)行知識(shí)更新。研究團(tuán)隊(duì)選擇了當(dāng)前最先進(jìn)的模型之一——LLaMA-3-8B,這個(gè)模型擁有80億個(gè)參數(shù),相當(dāng)于一個(gè)擁有龐大知識(shí)庫(kù)的超級(jí)專(zhuān)家。
測(cè)試內(nèi)容包括三類(lèi)典型的知識(shí)更新任務(wù)。第一類(lèi)是事實(shí)性知識(shí)更新,比如更正"某某公司的CEO是誰(shuí)"這樣的基礎(chǔ)事實(shí)。第二類(lèi)是反事實(shí)知識(shí)學(xué)習(xí),比如讓模型學(xué)習(xí)一個(gè)虛構(gòu)的事實(shí)"如果重力方向相反會(huì)怎樣"。第三類(lèi)是大規(guī)模知識(shí)編輯,一次性更新成千上萬(wàn)條相關(guān)信息。
在每類(lèi)測(cè)試中,研究團(tuán)隊(duì)都用兩個(gè)維度來(lái)評(píng)估性能:編輯成功率(新知識(shí)學(xué)得怎么樣)和能力保持率(原有能力是否受損)。這就像評(píng)估一個(gè)學(xué)生學(xué)新課程的表現(xiàn):既要看新課程的成績(jī),也要看其他科目的成績(jī)是否因此下降。
結(jié)果令人印象深刻。在事實(shí)性知識(shí)更新任務(wù)中,CrispEdit達(dá)到了80.5%的編輯成功率,同時(shí)在各項(xiàng)基礎(chǔ)能力測(cè)試中的表現(xiàn)與原模型幾乎沒(méi)有差異——數(shù)學(xué)推理能力保持在76%,常識(shí)問(wèn)答保持在69.5%,指令遵循能力保持在67.9%。相比之下,其他方法要么編輯成功率很低,要么在基礎(chǔ)能力上出現(xiàn)了顯著下降。
特別值得注意的是評(píng)估方式的改進(jìn)。傳統(tǒng)的模型編輯評(píng)估往往采用"提示-回答"的方式,即給模型一個(gè)問(wèn)題,讓它選擇正確答案。但這種評(píng)估方式過(guò)于理想化,因?yàn)樗僭O(shè)模型總是在回答預(yù)設(shè)的標(biāo)準(zhǔn)問(wèn)題。研究團(tuán)隊(duì)采用了更接近實(shí)際應(yīng)用的評(píng)估方式:讓模型在開(kāi)放式對(duì)話(huà)中自然地表達(dá)更新后的知識(shí),然后用另一個(gè)AI系統(tǒng)來(lái)判斷回答的正確性。
在這種更嚴(yán)格的評(píng)估下,許多看起來(lái)很好的傳統(tǒng)方法都暴露出了問(wèn)題:它們可能在標(biāo)準(zhǔn)測(cè)試中表現(xiàn)不錯(cuò),但在實(shí)際對(duì)話(huà)中卻無(wú)法正確運(yùn)用更新的知識(shí),或者出現(xiàn)了語(yǔ)言表達(dá)的問(wèn)題。而CrispEdit在這種嚴(yán)格評(píng)估下依然保持了優(yōu)秀的表現(xiàn)。
五、性能對(duì)比:站在巨人肩膀上的新突破
為了更好地理解CrispEdit的優(yōu)勢(shì),研究團(tuán)隊(duì)將其與當(dāng)前學(xué)術(shù)界和工業(yè)界的主流方法進(jìn)行了全面比較。這些對(duì)比方法可以分為幾個(gè)主要類(lèi)別,每種都代表了不同的設(shè)計(jì)哲學(xué)。
第一類(lèi)是"定位-編輯"方法,代表性的包括MEMIT和AlphaEdit。這類(lèi)方法的思路是先找到存儲(chǔ)特定知識(shí)的神經(jīng)元位置,然后直接修改這些神經(jīng)元。這就像在圖書(shū)館中找到某本書(shū)的確切位置,然后直接替換其中的某些頁(yè)面。這種方法的優(yōu)點(diǎn)是針對(duì)性強(qiáng),但缺點(diǎn)是可能過(guò)于局限——如果對(duì)知識(shí)存儲(chǔ)位置的判斷有誤,或者知識(shí)以分布式方式存儲(chǔ),這種方法就可能失效。
實(shí)驗(yàn)結(jié)果顯示,MEMIT在大部分測(cè)試中幾乎完全失效,編輯成功率接近0%。這表明直接定位和修改的策略在大型現(xiàn)代模型中遇到了根本性困難。AlphaEdit表現(xiàn)要好一些,在某些任務(wù)中能達(dá)到70%左右的編輯成功率,但代價(jià)是基礎(chǔ)能力的顯著下降——數(shù)學(xué)能力從原來(lái)的73.5%下降到45.5%,常識(shí)推理從69.5%下降到52.7%。
第二類(lèi)是"約束微調(diào)"方法,包括LocBF-FT、Adam-NSCL等。這類(lèi)方法的策略是在傳統(tǒng)的梯度下降更新中加入各種約束,防止更新過(guò)程偏離得太遠(yuǎn)。這就像給汽車(chē)安裝限速器和方向盤(pán)鎖,確保它只能在安全范圍內(nèi)行駛。
Adam-NSCL的具體做法是限制更新只能發(fā)生在激活值協(xié)方差矩陣的零空間內(nèi)。聽(tīng)起來(lái)很復(fù)雜,但簡(jiǎn)單理解就是:它只允許在那些"看起來(lái)不會(huì)影響現(xiàn)有功能"的方向上進(jìn)行更新。研究團(tuán)隊(duì)的理論分析證明,這種約束實(shí)際上比CrispEdit的約束更加嚴(yán)格——相當(dāng)于只能在更窄的"安全通道"中行駛。實(shí)驗(yàn)結(jié)果也驗(yàn)證了這一點(diǎn):Adam-NSCL的編輯成功率只有16.6%,遠(yuǎn)低于CrispEdit的80.5%。
LocBF-FT采用了另一種約束策略:它只更新模型中的某一個(gè)特定層,通過(guò)限制更新范圍來(lái)減少副作用。這種方法在小規(guī)模編輯時(shí)表現(xiàn)不錯(cuò),但當(dāng)編輯規(guī)模擴(kuò)大到1萬(wàn)條時(shí),性能就急劇下降,編輯成功率從69.5%掉到53.5%。這說(shuō)明單層更新的容量限制成為了瓶頸。
第三類(lèi)是通用的參數(shù)高效方法,如LoRA(低秩適應(yīng))。這類(lèi)方法原本是為了解決大模型微調(diào)的計(jì)算成本問(wèn)題而設(shè)計(jì)的,它們通過(guò)只更新一小部分參數(shù)來(lái)實(shí)現(xiàn)模型適應(yīng)。在知識(shí)編輯場(chǎng)景中,這類(lèi)方法表現(xiàn)一般,主要問(wèn)題是缺乏針對(duì)性的能力保護(hù)機(jī)制。
最有趣的對(duì)比是與傳統(tǒng)的全量微調(diào)(FT)。全量微調(diào)就是不加任何約束地直接用新數(shù)據(jù)訓(xùn)練模型,這是最簡(jiǎn)單直接的方法。單次微調(diào)時(shí),它能達(dá)到46.8%的編輯成功率,但基礎(chǔ)能力會(huì)有一定下降。更嚴(yán)重的問(wèn)題出現(xiàn)在序列編輯中:連續(xù)進(jìn)行多輪微調(diào)后,模型的表現(xiàn)急劇惡化,最終編輯成功率降到3.6%,多項(xiàng)基礎(chǔ)能力也大幅下降。
相比之下,CrispEdit不僅在單次編輯中表現(xiàn)優(yōu)秀,在序列編輯中也保持了穩(wěn)定性。經(jīng)過(guò)多輪編輯后,其成功率雖然有所下降(從80.5%降到71.1%),但依然遠(yuǎn)高于其他方法,基礎(chǔ)能力的保持也相對(duì)較好。
六、深入分析:為什么CrispEdit如此有效
為了理解CrispEdit成功的深層原因,研究團(tuán)隊(duì)進(jìn)行了一系列分析實(shí)驗(yàn),就像醫(yī)生要了解藥物的作用機(jī)理一樣。
首先他們測(cè)試了能力數(shù)據(jù)集大小的影響。回憶一下,CrispEdit需要用一個(gè)"能力數(shù)據(jù)集"來(lái)繪制模型的能力地形圖。一個(gè)自然的問(wèn)題是:這個(gè)數(shù)據(jù)集需要多大才夠用?
令人驚訝的是,實(shí)驗(yàn)顯示CrispEdit對(duì)能力數(shù)據(jù)集的大小相當(dāng)不敏感。即使只用100個(gè)樣本,它也能保持基礎(chǔ)能力在可接受的范圍內(nèi);用1000個(gè)樣本時(shí),性能就已經(jīng)接近用10萬(wàn)個(gè)樣本的效果。這個(gè)發(fā)現(xiàn)很重要,因?yàn)樗馕吨趯?shí)際應(yīng)用中,我們不需要準(zhǔn)備龐大的能力數(shù)據(jù)集就能享受CrispEdit的好處。
但是,當(dāng)研究團(tuán)隊(duì)完全移除投影約束(相當(dāng)于移除安全導(dǎo)航系統(tǒng))時(shí),模型的能力保持就出現(xiàn)了嚴(yán)重問(wèn)題。這證明了約束機(jī)制確實(shí)是必需的,而不是可有可無(wú)的裝飾。
接下來(lái)他們測(cè)試了能量閾值γ的敏感性。這個(gè)參數(shù)控制了"安全通道"的寬窄——γ越大,允許的更新范圍越小,安全性越高但編輯能力可能受限;γ越小則相反。
實(shí)驗(yàn)顯示,CrispEdit在相當(dāng)寬的γ范圍內(nèi)(0.5到0.99)都能保持良好性能,這表明用戶(hù)不需要精心調(diào)節(jié)這個(gè)參數(shù)就能獲得好的效果。不過(guò),針對(duì)不同類(lèi)型的編輯任務(wù),確實(shí)存在一個(gè)相對(duì)最優(yōu)的γ值:事實(shí)性編輯適合用0.7,而更復(fù)雜的知識(shí)更新則適合用0.9。
規(guī)模擴(kuò)展性的測(cè)試也很重要。當(dāng)編輯任務(wù)從3000條擴(kuò)展到1萬(wàn)條時(shí),大部分基線方法都出現(xiàn)了性能下降。特別是AlphaEdit,其編輯成功率從74.9%急劇下降到0.3%,這表明其方法存在嚴(yán)重的擴(kuò)展性問(wèn)題。而CrispEdit的性能下降相對(duì)平緩,從79.4%下降到77.4%,依然保持在可用范圍內(nèi)。
研究團(tuán)隊(duì)還在不同的模型架構(gòu)上測(cè)試了CrispEdit的通用性。除了LLaMA-3-8B,他們還在Qwen-2.5-1.5B上進(jìn)行了實(shí)驗(yàn)。盡管這兩個(gè)模型的架構(gòu)和訓(xùn)練數(shù)據(jù)都有顯著差異,CrispEdit依然表現(xiàn)出了一致的優(yōu)勢(shì),這說(shuō)明其方法具有良好的通用性。
特別有趣的是一個(gè)實(shí)現(xiàn)細(xì)節(jié)的發(fā)現(xiàn)。在序列編輯的K-FAC計(jì)算中,研究團(tuán)隊(duì)發(fā)現(xiàn)如果嚴(yán)格按照微調(diào)設(shè)置(只計(jì)算目標(biāo)token的損失)來(lái)計(jì)算統(tǒng)計(jì)量,效果反而不如計(jì)算完整序列的統(tǒng)計(jì)量。這個(gè)發(fā)現(xiàn)提醒我們,理論上看似合理的做法在實(shí)踐中可能需要調(diào)整。
七、實(shí)際應(yīng)用:從實(shí)驗(yàn)室走向現(xiàn)實(shí)世界
除了在標(biāo)準(zhǔn)benchmark上的表現(xiàn),研究團(tuán)隊(duì)還展示了CrispEdit在更接近實(shí)際應(yīng)用場(chǎng)景中的表現(xiàn)。他們?cè)O(shè)計(jì)了一些定性的案例研究,讓我們能夠直觀地看到不同方法的效果差異。
考慮這樣一個(gè)例子:需要更新"Marina Rebeka的聲音類(lèi)型是什么?"這個(gè)問(wèn)題的答案為"mezzo-soprano"(女中音)。在理想情況下,更新后的模型應(yīng)該能流暢自然地回答這個(gè)問(wèn)題,就像一個(gè)真正了解這個(gè)信息的人一樣。
但實(shí)驗(yàn)結(jié)果顯示,許多方法都出現(xiàn)了各種奇怪的問(wèn)題。Adam-NSCL生成的回答是"mezzo-srano-srano-srano...",不停地重復(fù)錯(cuò)誤的詞匯;傳統(tǒng)微調(diào)方法也出現(xiàn)了類(lèi)似的重復(fù)問(wèn)題;LocBF-FT的回答是"mezzo-oprano",雖然接近但不準(zhǔn)確;只有AlphaEdit和CrispEdit生成了正確且自然的回答。
這種現(xiàn)象揭示了一個(gè)重要問(wèn)題:在評(píng)估知識(shí)編輯效果時(shí),不能僅僅看模型是否"知道"正確答案,還要看它能否自然流暢地表達(dá)這個(gè)答案。許多方法雖然在技術(shù)指標(biāo)上看起來(lái)不錯(cuò),但在實(shí)際使用中會(huì)產(chǎn)生各種語(yǔ)言表達(dá)問(wèn)題。
另一個(gè)案例涉及更復(fù)雜的知識(shí):"Cebu flowerpecker的狀態(tài)是什么?"答案是"endangered species"(瀕危物種)。這個(gè)例子更具挑戰(zhàn)性,因?yàn)樗婕暗较鄬?duì)罕見(jiàn)的知識(shí),而且答案是一個(gè)專(zhuān)業(yè)術(shù)語(yǔ)。
在這個(gè)案例中,問(wèn)題更加突出。Adam-NSCL不僅給出了正確答案,還開(kāi)始無(wú)休止地重復(fù)"endangered species Data Deficient species endangered species...";傳統(tǒng)微調(diào)也出現(xiàn)了嚴(yán)重的重復(fù)問(wèn)題;UltraEdit的回答是"critically endangered species",語(yǔ)義上接近但技術(shù)上不準(zhǔn)確;只有LocBF-FT和CrispEdit給出了簡(jiǎn)潔正確的回答。
這些案例研究揭示了一個(gè)關(guān)鍵洞察:知識(shí)編輯不僅僅是一個(gè)"知識(shí)存儲(chǔ)"問(wèn)題,更是一個(gè)"知識(shí)表達(dá)"問(wèn)題。一個(gè)好的編輯方法不僅要確保模型學(xué)會(huì)新知識(shí),還要確保它能夠在適當(dāng)?shù)恼Z(yǔ)境中自然地運(yùn)用這些知識(shí),同時(shí)保持正常的語(yǔ)言表達(dá)能力。
從計(jì)算效率的角度來(lái)看,CrispEdit也表現(xiàn)優(yōu)秀。在編輯3000條記錄的任務(wù)中,CrispEdit只需要4分6秒,相比之下MEMIT需要9小時(shí)27分鐘,AlphaEdit需要7小時(shí)19分鐘。這種效率優(yōu)勢(shì)主要來(lái)自于其設(shè)計(jì)的簡(jiǎn)潔性:CrispEdit本質(zhì)上就是在標(biāo)準(zhǔn)梯度下降的基礎(chǔ)上加上了投影約束,沒(méi)有引入復(fù)雜的額外計(jì)算。
更重要的是,CrispEdit的K-FAC統(tǒng)計(jì)量可以預(yù)先計(jì)算并重復(fù)使用。這意味著在實(shí)際部署中,系統(tǒng)可以離線計(jì)算好能力保護(hù)所需的統(tǒng)計(jì)信息,然后在需要進(jìn)行知識(shí)更新時(shí)快速應(yīng)用。這種設(shè)計(jì)使得CrispEdit特別適合那些需要頻繁更新知識(shí)的實(shí)際應(yīng)用場(chǎng)景。
八、理論貢獻(xiàn):建立新的理解框架
除了實(shí)際的性能提升,CrispEdit的研究還為我們理解知識(shí)編輯問(wèn)題提供了新的理論框架。這個(gè)框架的核心是將知識(shí)編輯視為一個(gè)約束優(yōu)化問(wèn)題,而不是傳統(tǒng)的無(wú)約束優(yōu)化或啟發(fā)式方法。
傳統(tǒng)的知識(shí)編輯方法往往基于各種啟發(fā)式假設(shè),比如"知識(shí)存儲(chǔ)在特定位置"或"應(yīng)該限制在某些表示空間內(nèi)更新"。這些假設(shè)雖然直觀,但缺乏堅(jiān)實(shí)的理論基礎(chǔ),也難以在不同場(chǎng)景下保持一致的效果。
CrispEdit提出的框架則更加根本:它直接從"保持能力不變"這個(gè)核心需求出發(fā),通過(guò)數(shù)學(xué)優(yōu)化的方法自動(dòng)找到滿(mǎn)足約束的更新方向。這種方法的優(yōu)勢(shì)在于,它不需要對(duì)知識(shí)在模型中的存儲(chǔ)方式做任何假設(shè),而是讓數(shù)據(jù)和優(yōu)化過(guò)程自己告訴我們什么樣的更新是安全的。
這個(gè)理論框架還統(tǒng)一了許多看似不同的現(xiàn)有方法。研究團(tuán)隊(duì)證明,像AlphaEdit這樣的方法實(shí)際上可以看作是CrispEdit的一個(gè)特殊(且更受限)的情況。這種統(tǒng)一理解有助于我們更好地分析不同方法的優(yōu)劣,也為未來(lái)的研究提供了清晰的發(fā)展方向。
Bregman散度的引入也具有重要的理論意義。傳統(tǒng)的二階方法通常需要假設(shè)模型已經(jīng)收斂到局部最優(yōu)點(diǎn),這在實(shí)際的大規(guī)模模型訓(xùn)練中很少能滿(mǎn)足。Bregman散度框架避免了這個(gè)限制,使得二階優(yōu)化方法能夠應(yīng)用到更現(xiàn)實(shí)的場(chǎng)景中。
更深層次地說(shuō),這項(xiàng)研究揭示了一個(gè)重要的設(shè)計(jì)原則:在復(fù)雜系統(tǒng)中進(jìn)行局部修改時(shí),應(yīng)該優(yōu)先選擇那些對(duì)全局行為影響最小的修改方向。這個(gè)原則不僅適用于神經(jīng)網(wǎng)絡(luò),也可能對(duì)其他需要在線更新的復(fù)雜系統(tǒng)有指導(dǎo)意義。
說(shuō)到底,CrispEdit的成功證明了一個(gè)簡(jiǎn)單但深刻的道理:有時(shí)候,解決復(fù)雜問(wèn)題的最好方法不是發(fā)明全新的復(fù)雜技術(shù),而是將問(wèn)題重新表述,然后應(yīng)用已有的成熟工具以全新的方式來(lái)解決它。通過(guò)將知識(shí)編輯重新表述為約束優(yōu)化問(wèn)題,研究團(tuán)隊(duì)得以利用數(shù)學(xué)優(yōu)化和二階方法的強(qiáng)大工具,創(chuàng)造出了一個(gè)既簡(jiǎn)潔又有效的解決方案。
這項(xiàng)研究為大語(yǔ)言模型的實(shí)用化邁出了重要一步。在AI助手日益普及的今天,如何讓這些系統(tǒng)能夠安全、高效地學(xué)習(xí)新知識(shí),同時(shí)保持原有的可靠性,是一個(gè)至關(guān)重要的技術(shù)挑戰(zhàn)。CrispEdit提供的不僅是一個(gè)具體的技術(shù)解決方案,更是一個(gè)全新的思考框架,相信這會(huì)啟發(fā)更多后續(xù)研究,最終讓AI系統(tǒng)變得更加智能和可靠。對(duì)于那些希望深入了解這項(xiàng)技術(shù)細(xì)節(jié)的讀者,可以通過(guò)論文編號(hào)arXiv:2602.15823v1查找完整的技術(shù)文檔。
Q&A
Q1:CrispEdit方法與傳統(tǒng)的大模型知識(shí)更新方法有什么區(qū)別?
A:傳統(tǒng)方法通常采用直接修改或無(wú)約束微調(diào)的方式,容易造成模型原有能力的損失。CrispEdit則像一個(gè)精準(zhǔn)的"知識(shí)手術(shù)刀",它會(huì)先分析模型的參數(shù)空間,找到那些對(duì)整體能力影響最小的"安全路徑",然后只在這些路徑上進(jìn)行知識(shí)更新。這樣既能學(xué)會(huì)新知識(shí),又能最大程度保護(hù)原有的各種能力。
Q2:為什么CrispEdit能在大型語(yǔ)言模型上高效運(yùn)行?
A:CrispEdit的效率來(lái)自?xún)蓚€(gè)關(guān)鍵技術(shù):一是使用K-FAC技術(shù)將復(fù)雜的全局分析分解為許多簡(jiǎn)單的局部分析,大大降低了計(jì)算復(fù)雜度;二是開(kāi)發(fā)了"免存儲(chǔ)"的投影技術(shù),不需要構(gòu)建完整的參數(shù)地圖,而是實(shí)時(shí)計(jì)算最佳更新路徑。這使得原本需要萬(wàn)億級(jí)計(jì)算的問(wèn)題壓縮到千萬(wàn)級(jí),同時(shí)保持高精度。
Q3:CrispEdit適用于哪些實(shí)際應(yīng)用場(chǎng)景?
A:CrispEdit特別適合需要頻繁更新知識(shí)的AI應(yīng)用,比如需要及時(shí)更新時(shí)事信息的智能問(wèn)答系統(tǒng)、需要學(xué)習(xí)新產(chǎn)品信息的客服機(jī)器人、或者需要糾正錯(cuò)誤信息的教育AI助手。它既支持一次性大批量更新,也支持持續(xù)的漸進(jìn)式學(xué)習(xí),而且能夠預(yù)先計(jì)算保護(hù)機(jī)制,在實(shí)際部署中快速應(yīng)用。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.