<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      調(diào)整訓(xùn)練數(shù)據(jù)出場順序大模型就能變聰明!無需擴(kuò)大模型/數(shù)據(jù)規(guī)模

      0
      分享至

      DELT團(tuán)隊(duì) 投稿
      量子位 | 公眾號 QbitAI

      模型訓(xùn)練重點(diǎn)在于數(shù)據(jù)的數(shù)量與質(zhì)量?其實(shí)還有一個(gè)關(guān)鍵因素——

      數(shù)據(jù)的出場順序。

      對此,微軟亞洲研究院提出了一種全新的文本數(shù)據(jù)組織范式DELT(Data Efficacy in LM Training),通過引入數(shù)據(jù)排序策略,充分挖掘訓(xùn)練數(shù)據(jù)潛力,在不同模型尺寸與規(guī)模下都達(dá)到了良好性能。



      數(shù)據(jù)效率與效能提升

      該方法用優(yōu)化訓(xùn)練數(shù)據(jù)的組織方式來讓語言模型學(xué)得更好,還不用增加數(shù)據(jù)量或擴(kuò)大模型規(guī)模

      來看看是怎么做到的。

      訓(xùn)練樣本的組織順序很關(guān)鍵

      首先,我們先來理清幾個(gè)概念。

      在語言模型訓(xùn)練中,數(shù)據(jù)使用效率至關(guān)重要。現(xiàn)有研究多關(guān)注于數(shù)據(jù)效率(Data Efficiency),即如何通過數(shù)據(jù)選擇提升模型訓(xùn)練效率并保持優(yōu)異性能。

      然而,數(shù)據(jù)效能(Data Efficacy),即如何通過數(shù)據(jù)組織增強(qiáng)模型訓(xùn)練表現(xiàn),卻常常被忽視。

      以烹飪?yōu)槔瑪?shù)據(jù)效率就像在市場挑選新鮮、合適的食材,而數(shù)據(jù)效能則像名廚把握投放調(diào)料的時(shí)機(jī)與分寸,讓菜品發(fā)揮出最佳風(fēng)味。

      數(shù)據(jù)組織的重要性

      為了避免過擬合,當(dāng)前的大語言模型往往在海量數(shù)據(jù)上進(jìn)行訓(xùn)練,并且訓(xùn)練的次數(shù)非常有限,甚至僅進(jìn)行一次完整的訓(xùn)練周期(epoch=1),這與早期模型依賴多次迭代訓(xùn)練(epoch>>1)截然不同。

      這些變化讓數(shù)據(jù)呈現(xiàn)的先后順序?qū)Y(jié)果影響巨大

      早期的AI模型類似于讓學(xué)生多次反復(fù)翻閱同一本書,在多輪學(xué)習(xí)中慢慢補(bǔ)齊細(xì)節(jié);而現(xiàn)在更像只給一遍通讀,不再反復(fù)回看。

      這就對閱讀順序提出了極高要求,必須精心規(guī)劃學(xué)習(xí)材料出現(xiàn)的先后和結(jié)構(gòu)。因此,訓(xùn)練樣本的組織順序顯得尤為關(guān)鍵。然而,關(guān)于這一點(diǎn)的研究卻很少。

      基于此觀察,微軟亞洲研究院最新提出的文本數(shù)據(jù)組織范式DELT,通過引入數(shù)據(jù)排序策略,充分挖掘訓(xùn)練數(shù)據(jù)潛力,實(shí)現(xiàn)了數(shù)據(jù)的高效利用與效能提升。



      DELT范式不但通過數(shù)據(jù)選擇提升效率,選取高質(zhì)量數(shù)據(jù),加快訓(xùn)練速度;

      而且通過數(shù)據(jù)排序提升效能,在預(yù)訓(xùn)練和后訓(xùn)練階段都顯著提升了模型性能,且適用于通用、數(shù)學(xué)和代碼等多領(lǐng)域任務(wù)。

      給模型按部就班安排訓(xùn)練課程
      數(shù)據(jù)訓(xùn)練效能定義Data Efficacy

      研究首先定義了數(shù)據(jù)訓(xùn)練效能(Data Efficacy),是指通過優(yōu)化訓(xùn)練數(shù)據(jù)的組織方式來最大化語言模型的性能表現(xiàn),而無需改變數(shù)據(jù)內(nèi)容或模型架構(gòu)。

      與以往關(guān)注的“數(shù)據(jù)訓(xùn)練效率” (Data Efficiency) 側(cè)重?cái)?shù)據(jù)篩選的研究目的不同,數(shù)據(jù)效能強(qiáng)調(diào)對訓(xùn)練數(shù)據(jù)的評分和排序,以充分挖掘數(shù)據(jù)的潛在價(jià)值。

      數(shù)據(jù)順序在語言模型訓(xùn)練中的潛力尚未被充分挖掘, 數(shù)據(jù)效能旨在通過合理的數(shù)據(jù)組織方式,使模型在有限的訓(xùn)練數(shù)據(jù)和資源下實(shí)現(xiàn)更高的性能和泛化能力,成為提升語言模型性能的一種新興方法。

      數(shù)據(jù)組織范式DELT介紹



      DELT范式架構(gòu)

      DELT(DataEfficacy inLMTraining)是一種創(chuàng)新的文本數(shù)據(jù)組織范式。

      它集成了數(shù)據(jù)評分(Data Scoring)、數(shù)據(jù)選擇(Data Selection) 和數(shù)據(jù)排序(Data Ordering) 三大核心組件。

      數(shù)據(jù)評分根據(jù)特定的屬性為每個(gè)樣本賦予分?jǐn)?shù),如:難度、質(zhì)量、多樣性等。

      數(shù)據(jù)選擇通過評分篩選出最優(yōu)子集(如:top-k、按閾值篩選等),然后數(shù)據(jù)排序根據(jù)評分重新組織所選擇數(shù)據(jù)的呈現(xiàn)順序(如:基于課程學(xué)習(xí)的分?jǐn)?shù)從低到高排列)。 為了兼顧數(shù)據(jù)處理效率,DELT范式的數(shù)據(jù)選擇和數(shù)據(jù)排序共用數(shù)據(jù)評分的結(jié)果。

      因此,數(shù)據(jù)評分的規(guī)則設(shè)置非常重要。于是,研究還提出了Learning-Quality Score(LQS)方法。



      LQS打分方式

      該數(shù)據(jù)評分方式結(jié)合了質(zhì)量可學(xué)習(xí)性兩個(gè)關(guān)鍵指標(biāo),不但可以篩選出低質(zhì)量數(shù)據(jù),而且也能捕捉數(shù)據(jù)在不同階段的訓(xùn)練價(jià)值,進(jìn)一步提供了可靠的數(shù)據(jù)排列順序。

      為了進(jìn)一步提升數(shù)據(jù)效能,團(tuán)隊(duì)還提出了一種全新的折疊排序方法Folding Ordering(FO)。

      基于課程學(xué)習(xí)的排序(即,按分?jǐn)?shù)升序排序)可能導(dǎo)致模型遺忘和數(shù)據(jù)內(nèi)部分布偏差。

      折疊排序策略通過多層“折疊”,將數(shù)據(jù)按分?jǐn)?shù)分層并多次采樣,無重復(fù)且均衡分布。



      Folding排序方式

      相比隨機(jī)打亂或單一排序,它既保留難度排序優(yōu)勢,又避免模型過度遺忘或依賴特定數(shù)據(jù),提升了魯棒性和泛化能力。

      與傳統(tǒng)隨機(jī)排序方法相比,DELT范式不僅通過減小數(shù)據(jù)規(guī)模提升了訓(xùn)練效率;而且在不同模型尺寸和數(shù)據(jù)規(guī)模下,在各種評測集上都顯著提升了模型性能。



      不同數(shù)據(jù)規(guī)模和模型尺寸下的結(jié)果

      DELT給Data-centric AI領(lǐng)域帶來了全新思路。

      看來,類比于人類教學(xué)實(shí)踐,講究個(gè)性化與按部就班地安排學(xué)習(xí)內(nèi)容,AI訓(xùn)練也需要類似的學(xué)習(xí)方法。

      論文鏈接:https://arxiv.org/abs/2506.21545
      代碼鏈接:https://github.com/microsoft/DELT

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      瑞典為何結(jié)束210年中立,加入北約并援烏近百億美元?

      瑞典為何結(jié)束210年中立,加入北約并援烏近百億美元?

      高博新視野
      2026-02-22 20:16:40
      “體壇敗類”馬俊仁,強(qiáng)迫隊(duì)員集體切闌尾,親自為女隊(duì)員打禁藥

      “體壇敗類”馬俊仁,強(qiáng)迫隊(duì)員集體切闌尾,親自為女隊(duì)員打禁藥

      米果說識(shí)
      2026-02-22 11:29:00
      德媒稱美即將打擊伊朗,伊朗外長呼吁和平解決問題

      德媒稱美即將打擊伊朗,伊朗外長呼吁和平解決問題

      參考消息
      2026-02-23 15:04:55
      “我就是她取精生子的工具”清華學(xué)霸哭訴,撕開了女富豪的遮羞布

      “我就是她取精生子的工具”清華學(xué)霸哭訴,撕開了女富豪的遮羞布

      北緯的咖啡豆
      2026-02-20 19:12:17
      CCTV直播!國乒2人出局 張本智和爆冷 孫穎莎首秀 新加坡大滿貫23日賽程

      CCTV直播!國乒2人出局 張本智和爆冷 孫穎莎首秀 新加坡大滿貫23日賽程

      好乒乓
      2026-02-23 09:31:40
      那爾那茜報(bào)復(fù)陳麗君!?

      那爾那茜報(bào)復(fù)陳麗君!?

      八卦瘋叔
      2026-02-23 10:54:55
      俄大使館在首爾打出巨幅標(biāo)語,韓方要求撤下被拒

      俄大使館在首爾打出巨幅標(biāo)語,韓方要求撤下被拒

      觀察者網(wǎng)
      2026-02-23 10:45:05
      郭德綱完勝,相聲春晚沒有讓大家失望,誰說德云社的相聲不高雅的

      郭德綱完勝,相聲春晚沒有讓大家失望,誰說德云社的相聲不高雅的

      陌識(shí)
      2026-02-18 00:38:17
      AGI時(shí)代,養(yǎng)老金將變得毫無意義?大白話告訴你AGI到底是什么?

      AGI時(shí)代,養(yǎng)老金將變得毫無意義?大白話告訴你AGI到底是什么?

      我不叫阿哏
      2026-02-22 13:14:03
      廣西小伙愛上深圳富婆,富婆大他20歲,七夕送價(jià)值300萬邁巴赫

      廣西小伙愛上深圳富婆,富婆大他20歲,七夕送價(jià)值300萬邁巴赫

      情感藝術(shù)家
      2026-02-22 15:47:47
      博士讀著讀著導(dǎo)師變后媽,畢業(yè)還延期了…還有更離譜的嗎?

      博士讀著讀著導(dǎo)師變后媽,畢業(yè)還延期了…還有更離譜的嗎?

      超級數(shù)學(xué)建模
      2026-02-22 22:38:39
      陳俊菘2-3惜敗張本智和無緣32強(qiáng)!兩局因保守輸球,還是太年輕!

      陳俊菘2-3惜敗張本智和無緣32強(qiáng)!兩局因保守輸球,還是太年輕!

      籃球資訊達(dá)人
      2026-02-23 14:15:16
      冬奧會(huì)結(jié)束后,中國隊(duì)3大歸化將告別國家隊(duì),原因曝光

      冬奧會(huì)結(jié)束后,中國隊(duì)3大歸化將告別國家隊(duì),原因曝光

      何老師呀
      2026-02-23 06:42:23
      安吉麗娜·朱莉宣布不再“承認(rèn)美國”為祖國:計(jì)劃7月舉家遷居海外

      安吉麗娜·朱莉宣布不再“承認(rèn)美國”為祖國:計(jì)劃7月舉家遷居海外

      喜歡歷史的阿繁
      2026-02-23 13:08:14
      不可思議!一殯儀館38歲逝者骨灰去處標(biāo)注,居然是“不要了”…

      不可思議!一殯儀館38歲逝者骨灰去處標(biāo)注,居然是“不要了”…

      火山詩話
      2026-02-23 10:25:40
      京東上的假貨,為何如此招搖?

      京東上的假貨,為何如此招搖?

      呦呦鹿鳴
      2026-02-22 21:20:32
      航天科研人員趙學(xué)軍留學(xué)被策反,回國后大量搜集核心要害情報(bào)提供給境外間諜,央視披露細(xì)節(jié):才到國外就被盯上,請吃燒烤增進(jìn)感情

      航天科研人員趙學(xué)軍留學(xué)被策反,回國后大量搜集核心要害情報(bào)提供給境外間諜,央視披露細(xì)節(jié):才到國外就被盯上,請吃燒烤增進(jìn)感情

      極目新聞
      2026-02-23 15:04:52
      1比4慘敗!張本美和遇新克星,舊仇未報(bào)又添新恨

      1比4慘敗!張本美和遇新克星,舊仇未報(bào)又添新恨

      卿子書
      2026-02-23 11:18:26
      谷愛凌逆襲奪第5金!最新金牌榜中國隊(duì)甩開韓澳英,追上日本隊(duì)

      谷愛凌逆襲奪第5金!最新金牌榜中國隊(duì)甩開韓澳英,追上日本隊(duì)

      老吳說體育
      2026-02-22 19:24:01
      廣西貴港一男子離婚后發(fā)現(xiàn)女兒非親生,起訴更換撫養(yǎng)權(quán),退還撫養(yǎng)費(fèi)并要求精神損失賠償,法院:被告返還撫養(yǎng)費(fèi)4萬,支付精神損害撫慰金8千

      廣西貴港一男子離婚后發(fā)現(xiàn)女兒非親生,起訴更換撫養(yǎng)權(quán),退還撫養(yǎng)費(fèi)并要求精神損失賠償,法院:被告返還撫養(yǎng)費(fèi)4萬,支付精神損害撫慰金8千

      極目新聞
      2026-02-23 13:41:59
      2026-02-23 16:27:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動(dòng)態(tài)
      12192文章數(shù) 176389關(guān)注度
      往期回顧 全部

      科技要聞

      騰訊字節(jié),“火拼”漫劇

      頭條要聞

      特朗普被指考慮對伊朗先“小打”再“大打”

      頭條要聞

      特朗普被指考慮對伊朗先“小打”再“大打”

      體育要聞

      哈登版騎士首敗:雷霆的冠軍課

      娛樂要聞

      谷愛凌奶奶去世,谷愛凌淚奔

      財(cái)經(jīng)要聞

      結(jié)婚五金邁入10萬大關(guān) 年輕人結(jié)婚更難了

      汽車要聞

      續(xù)航1810km!smart精靈#6 EHD超級電混2026年上市

      態(tài)度原創(chuàng)

      藝術(shù)
      本地
      數(shù)碼
      房產(chǎn)
      公開課

      藝術(shù)要聞

      十大名家畫春,送給春天的你!

      本地新聞

      春花齊放2026:《駿馬奔騰迎新歲》

      數(shù)碼要聞

      摩爾線程自研筆記本引老外關(guān)注!首發(fā)“長江”處理器 Linux/安卓/Windows隨心切換

      房產(chǎn)要聞

      窗前即地標(biāo)!獨(dú)占三亞灣C位 自貿(mào)港總裁行宮亮相

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版