<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      金魚損失隨機(jī)剔除token,讓AI不再死記硬背

      0
      分享至

      henry 發(fā)自 凹非寺
      量子位 | 公眾號(hào) QbitAI

      訓(xùn)練大模型時(shí),有時(shí)讓它“記性差一點(diǎn)”,反而更聰明!

      大語(yǔ)言模型如果不加約束,很容易把訓(xùn)練數(shù)據(jù)原封不動(dòng)地復(fù)刻出來(lái)。為解決這個(gè)問(wèn)題,來(lái)自馬里蘭大學(xué)、圖賓根大學(xué)和馬普所的研究團(tuán)隊(duì)提出了一個(gè)新方法——金魚損失(Goldfish Loss)



      顧名思義,金魚損失就是讓模型像金魚一樣,不去死記每一個(gè)細(xì)節(jié),而是在損失函數(shù)計(jì)算時(shí)隨機(jī)剔除一小部分token。

      由此,模型不再逐字記住訓(xùn)練集內(nèi)容,但仍能學(xué)會(huì)語(yǔ)言規(guī)律。

      實(shí)驗(yàn)顯示,LLaMA-2在使用金魚損失后:

      • 記憶化內(nèi)容顯著減少:模型不再?gòu)?fù)現(xiàn)訓(xùn)練數(shù)據(jù)
      • 下游任務(wù)性能幾乎不受影響:仍然能流暢生成文本

      用網(wǎng)友的精辟評(píng)論概括就是:dropout,但損失函數(shù)!



      在梯度計(jì)算中隨機(jī)屏蔽部分token

      金魚損失的核心理念非常簡(jiǎn)單,就是在模型訓(xùn)練過(guò)程中隨機(jī)剔除一部分訓(xùn)練文本中的tokens,使其不參與損失計(jì)算。

      這樣一來(lái),當(dāng)模型在推理階段遇到這些位置時(shí),就只能“猜測(cè)”,而不是逐字逐句復(fù)現(xiàn)訓(xùn)練數(shù)據(jù)的完整序列。

      此外,為了保證被剔除token的一致性,研究人員設(shè)計(jì)了一種基于哈希(hashing)的掩碼策略。



      那么,這和同樣是防止模型背會(huì)的正則化方法有什么不同呢?

      Dropout這樣的正則化方法為例,它通過(guò)在訓(xùn)練時(shí)“加噪聲”來(lái)防止模型過(guò)度依賴某些參數(shù),從而提高模型舉一反三的能力。

      但這樣做的問(wèn)題在于:如果只是隨機(jī)丟token,那么,每次看到同一段落時(shí),丟掉的地方不一樣,模型累計(jì)幾次就能拼湊出完整段落。

      所以,說(shuō)到底,模型還是靠死記硬背,記住了答案。

      相比之下,金魚損失則用哈希掩碼確保每次遇到同一段落,掩蓋位置都一樣,這就從根本上阻止了模型復(fù)現(xiàn)完整訓(xùn)練文本。

      接下來(lái),我們來(lái)看金魚損失具體是怎么做的。

      在傳統(tǒng)的next-token prediction中,模型以序列中的下一個(gè)真實(shí)token作為目標(biāo),輸出預(yù)測(cè)分布,并基于該分布計(jì)算交叉熵?fù)p失。



      在金魚損失下,模型雖然也在前向傳播中預(yù)測(cè)序列里下一個(gè) token。但在計(jì)算損失時(shí),會(huì)以一定的概率將某些位置的token從損失計(jì)算里“抹掉”。

      也就是說(shuō),有些真實(shí)的下一個(gè)token不會(huì)作為目標(biāo)來(lái)訓(xùn)練。



      在這里,研究人員采用了簡(jiǎn)單的靜態(tài)掩碼(static mask),剔除每序列中的第4個(gè)token。

      更進(jìn)一步,為了確保模型不會(huì)從其他地方學(xué)到被掩碼的數(shù)據(jù)(例如不同的文檔會(huì)在不同的網(wǎng)頁(yè)中反復(fù)出現(xiàn)),研究團(tuán)隊(duì)還提出了一種局部化哈希掩碼(localized hashed mask),使得當(dāng)相同的前h個(gè)token出現(xiàn)時(shí),掩蓋模式是相同的(可重復(fù))。

      實(shí)驗(yàn)測(cè)試與結(jié)果

      為了驗(yàn)證金魚損失確實(shí)能防止記憶化,研究團(tuán)隊(duì)設(shè)計(jì)了兩種實(shí)驗(yàn)場(chǎng)景:

      一種是極端場(chǎng)景,通過(guò)對(duì)少量樣本進(jìn)行多個(gè)訓(xùn)練周期(即重復(fù))來(lái)強(qiáng)烈促使記憶化;

      另一種是標(biāo)準(zhǔn)場(chǎng)景,模擬現(xiàn)實(shí)模型訓(xùn)練中使用的批次處理方式 。

      同時(shí),為了評(píng)估模型的記憶化程度,研究采用了以下指標(biāo):

      • RougeL得分:該指標(biāo)衡量最長(zhǎng)公共(非連續(xù))子序列的長(zhǎng)度 。得分為1.0表示完美記憶 。
      • 精確匹配率(Exact Match):該指標(biāo)衡量正確預(yù)測(cè)的序列占真實(shí)序列的百分比.

      實(shí)驗(yàn)表明,在極端場(chǎng)景下,標(biāo)準(zhǔn)訓(xùn)練導(dǎo)致模型逐字記憶了100篇文章中的84篇,而金魚損失沒(méi)有記憶任何文章



      (注:實(shí)驗(yàn)讓LLaMA-2-7B在《哈利·波特》第一章或100篇維基百科文檔上進(jìn)一步訓(xùn)練了100個(gè)epoch)

      此外,在標(biāo)準(zhǔn)訓(xùn)練場(chǎng)景下,金魚損失也明顯減少了模型逐字復(fù)現(xiàn)訓(xùn)練語(yǔ)料庫(kù)中目標(biāo)序列的情況。



      但這里可能有個(gè)直覺式的反應(yīng)——如果讓模型“隨機(jī)漏學(xué)”一些token,它的能力會(huì)不會(huì)也隨之降低呢?

      對(duì)此,研究人員進(jìn)行了測(cè)試:研究表明,金魚損失模型、標(biāo)準(zhǔn)損失模型和對(duì)照模型之間的總體性能沒(méi)有系統(tǒng)性差異。



      需要注意的是,金魚損失的核心在于忽略部分token的梯度計(jì)算。因此,為了學(xué)到足夠的語(yǔ)言模式,模型必須通過(guò)更多數(shù)據(jù)來(lái)補(bǔ)償這些空缺,這可能導(dǎo)致計(jì)算效率的下降。

      [1]https://arxiv.org/pdf/2406.10209

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      一傳不穩(wěn)進(jìn)攻不利,吳夢(mèng)潔獨(dú)木難支!上海女排擊敗江蘇贏關(guān)鍵戰(zhàn)

      一傳不穩(wěn)進(jìn)攻不利,吳夢(mèng)潔獨(dú)木難支!上海女排擊敗江蘇贏關(guān)鍵戰(zhàn)

      金毛愛女排
      2025-12-17 21:42:05
      女高中生憑顏值火出圈,評(píng)論區(qū)沸騰:妥妥的985長(zhǎng)相

      女高中生憑顏值火出圈,評(píng)論區(qū)沸騰:妥妥的985長(zhǎng)相

      蝴蝶花雨話教育
      2025-12-13 08:53:20
      有情有義!保利尼奧拒絕巴西國(guó)家隊(duì)邀約:正考慮重回中超!

      有情有義!保利尼奧拒絕巴西國(guó)家隊(duì)邀約:正考慮重回中超!

      邱澤云
      2025-12-16 23:17:24
      夫妻性生活:女人最討厭的5種“床上行為”,男人千萬(wàn)別犯!

      夫妻性生活:女人最討厭的5種“床上行為”,男人千萬(wàn)別犯!

      精彩分享快樂(lè)
      2025-11-25 00:05:03
      對(duì)等關(guān)稅以來(lái),中國(guó)對(duì)美出口下降了26%,貿(mào)易盈余減少了30%

      對(duì)等關(guān)稅以來(lái),中國(guó)對(duì)美出口下降了26%,貿(mào)易盈余減少了30%

      子業(yè)一說(shuō)財(cái)經(jīng)
      2025-12-17 16:35:11
      不行就換!CBA土豪又開始了,才打2輪就換外援,新援曝光,夠豪橫

      不行就換!CBA土豪又開始了,才打2輪就換外援,新援曝光,夠豪橫

      萌蘭聊個(gè)球
      2025-12-17 10:37:59
      “血栓大戶”被揪出,是肥肉十倍,醫(yī)生:再不忌口,小心血管變硬

      “血栓大戶”被揪出,是肥肉十倍,醫(yī)生:再不忌口,小心血管變硬

      小胡軍事愛好
      2025-12-17 21:37:46
      30萬(wàn)級(jí)的瑪莎拉蒂,兩天被搶光!經(jīng)銷商稱“6點(diǎn)下班,被客戶堵到9點(diǎn)”,知情人士:這批車賣一輛虧一輛,不降價(jià)也不行

      30萬(wàn)級(jí)的瑪莎拉蒂,兩天被搶光!經(jīng)銷商稱“6點(diǎn)下班,被客戶堵到9點(diǎn)”,知情人士:這批車賣一輛虧一輛,不降價(jià)也不行

      每日經(jīng)濟(jì)新聞
      2025-12-15 19:03:06
      《老舅》結(jié)局:直到二美慘死,霍東風(fēng)出手殺大濤,才知,崔國(guó)明為何得癌慘死

      《老舅》結(jié)局:直到二美慘死,霍東風(fēng)出手殺大濤,才知,崔國(guó)明為何得癌慘死

      手工制作阿殲
      2025-12-16 03:37:56
      給人養(yǎng)了7年閑人,廣汽終于要關(guān)閉洛杉磯的研發(fā)中心

      給人養(yǎng)了7年閑人,廣汽終于要關(guān)閉洛杉磯的研發(fā)中心

      與車同樂(lè)
      2025-12-04 10:05:02
      好友相繼緬懷拼湊出,何晴生命最后時(shí)光:拮據(jù)、變樣、舍不下兒子

      好友相繼緬懷拼湊出,何晴生命最后時(shí)光:拮據(jù)、變樣、舍不下兒子

      阿郎娛樂(lè)
      2025-12-17 07:38:57
      大衣哥跳樓身亡、趙本山靈堂、宋佳知三當(dāng)三,現(xiàn)在造謠越來(lái)越離譜

      大衣哥跳樓身亡、趙本山靈堂、宋佳知三當(dāng)三,現(xiàn)在造謠越來(lái)越離譜

      好賢觀史記
      2025-12-17 09:12:04
      “每天回家我都想吐!”整整3年,因頂樓住戶一個(gè)操作,廣東一小區(qū)整棟樓業(yè)主直呼“苦不堪言”,多方最新回應(yīng)

      “每天回家我都想吐!”整整3年,因頂樓住戶一個(gè)操作,廣東一小區(qū)整棟樓業(yè)主直呼“苦不堪言”,多方最新回應(yīng)

      環(huán)球網(wǎng)資訊
      2025-12-17 07:32:29
      德國(guó)新任外長(zhǎng)訪華結(jié)束,德媒:和貝爾伯克不是一路人

      德國(guó)新任外長(zhǎng)訪華結(jié)束,德媒:和貝爾伯克不是一路人

      道德經(jīng)
      2025-12-18 00:30:09
      被默克爾說(shuō)中了!27國(guó)跟著美國(guó)對(duì)中國(guó)出手后,歐洲正滑向第三世界

      被默克爾說(shuō)中了!27國(guó)跟著美國(guó)對(duì)中國(guó)出手后,歐洲正滑向第三世界

      阿離家居
      2025-12-18 01:33:15
      運(yùn)-30首飛成功,將成為世界最強(qiáng)戰(zhàn)術(shù)運(yùn)輸機(jī)嗎?

      運(yùn)-30首飛成功,將成為世界最強(qiáng)戰(zhàn)術(shù)運(yùn)輸機(jī)嗎?

      世家寶
      2025-12-17 15:22:48
      墻倒眾人推!無(wú)緣冠軍的孫穎莎到底輸在哪?鄧亞萍的話一針見血

      墻倒眾人推!無(wú)緣冠軍的孫穎莎到底輸在哪?鄧亞萍的話一針見血

      丁丁鯉史紀(jì)
      2025-11-17 15:58:28
      曾風(fēng)靡一時(shí)的潮汕牛肉火鍋,為何如今涼了?網(wǎng)友:套路太深了

      曾風(fēng)靡一時(shí)的潮汕牛肉火鍋,為何如今涼了?網(wǎng)友:套路太深了

      餐飲新紀(jì)元
      2025-12-13 07:15:41
      梅西飛印度辦活動(dòng),首富300斤的小兒子熱情接待,拉迪卡胯是真的大

      梅西飛印度辦活動(dòng),首富300斤的小兒子熱情接待,拉迪卡胯是真的大

      小魚愛魚樂(lè)
      2025-12-17 17:26:10
      女企業(yè)竟嫁19歲體育生,一天5次性生活,8年后得知丈夫隱藏身份

      女企業(yè)竟嫁19歲體育生,一天5次性生活,8年后得知丈夫隱藏身份

      今天說(shuō)故事
      2025-09-12 18:14:21
      2025-12-18 02:47:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動(dòng)態(tài)
      11869文章數(shù) 176338關(guān)注度
      往期回顧 全部

      科技要聞

      特斯拉值1.6萬(wàn)億靠畫餅 Waymo值千億靠跑單

      頭條要聞

      墜亡女教師有已婚哥哥和未婚弟弟 父母被指不愿退彩禮

      頭條要聞

      墜亡女教師有已婚哥哥和未婚弟弟 父母被指不愿退彩禮

      體育要聞

      短短一年,從爭(zhēng)冠到0勝墊底...

      娛樂(lè)要聞

      狗仔曝?zé)岵〗愕軕僬嬲劻耍浚浚?/h3>

      財(cái)經(jīng)要聞

      重磅信號(hào)!收入分配制度或迎重大突破

      汽車要聞

      一車多動(dòng)力+雙姿態(tài) 長(zhǎng)城歐拉5上市 限時(shí)9.18萬(wàn)元起

      態(tài)度原創(chuàng)

      數(shù)碼
      本地
      家居
      公開課
      軍事航空

      數(shù)碼要聞

      RGB-Mini LED迎來(lái)“跨年夜”,“光色同控”從電視走向桌面

      本地新聞

      云游安徽|踏過(guò)戰(zhàn)壕與石板,讀一部活的淮北史

      家居要聞

      溫馨獨(dú)棟 駝色與淺色碰撞

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      最新現(xiàn)場(chǎng):山東艦完成年度最后一次海上訓(xùn)練

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 欧美最猛黑人xxxx| 国产熟女在线| 涪陵区| 中文字幕一卡二卡三卡| 四虎国产精品永久地址99| 国产+亚洲+制服| 欧美日韩午夜| 孟津县| 熟女丰满老熟女熟妇| 色妺妺视频网| 亚洲激情偷拍| 桃色91| 娇小萝被两个黑人用半米长| 国内精品久久久久久99蜜桃| 日本三级香港三级三级人妇久| 五月天激情影院| 综合一区亚洲| 99久久精品免费看国产一区二区三区| 视频一区二区三区中文字幕狠狠 | 综合一区二区三区| 兴业县| 国产又爽又大又黄a片| 永久免费AV无码网站YY| 久久精品熟妇丰满人妻99| 性饥渴熟妇乱子伦HD| 一本一道av无码中文字幕﹣百度| 欧美国产综合视频| 国产熟女在线播放第一页| 久久精品一卡二卡| 久久av高潮av无码av喷吹| 成人无号精品一区二区三区| 日韩精品久久| 天天澡日日澡狠狠澡欧美老妇| 欧美日韩中文国产一区发布| 国产亚洲精品综合99久久| 黑人无码在线| 国产精品天天狠天天看| 天海翼无码在线| 欧美啪啪视频| 99re免费| 欧美一区二区三区久久综合|