<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      北大林宙辰團(tuán)隊論文:從數(shù)據(jù)中自適應(yīng)學(xué)習(xí)時序預(yù)測損失丨ICLR 2026

      0
      分享至

      在多步時間序列預(yù)測任務(wù)中,預(yù)測性能隨時間步長迅速退化幾乎成為一種共識。例如:在氣象預(yù)測中,短期的溫度變化能夠較為準(zhǔn)確地刻畫,但當(dāng)預(yù)測跨度擴(kuò)展至數(shù)日甚至一周時,預(yù)測誤差就會逐漸放大,周期與趨勢結(jié)構(gòu)逐漸偏離真實軌跡。類似的問題在金融價格走勢和電力負(fù)荷預(yù)測等場景中也廣泛存在。

      無論模型結(jié)構(gòu)如何變化,當(dāng)預(yù)測范圍從短期擴(kuò)展至中長期時,誤差積累、趨勢漂移和結(jié)構(gòu)失真往往不可避免地出現(xiàn)。這類現(xiàn)象在實踐中被頻繁觀察,卻通常被視為模型表達(dá)能力或依賴建模不足的直接結(jié)果。

      然而,與模型結(jié)構(gòu)持續(xù)演進(jìn)形成鮮明對比的是,多步預(yù)測在訓(xùn)練階段所使用的損失函數(shù)卻長期保持固定。大多數(shù)方法仍以逐時間點的均方誤差(MSE)作為優(yōu)化目標(biāo),默認(rèn)將未來不同預(yù)測步視為相互獨立且重要性一致的預(yù)測對象。

      但是,多步預(yù)測并非一組彼此獨立的回歸任務(wù),未來不同時間點之間往往呈現(xiàn)顯著的相關(guān)性;此外,不同預(yù)測步在優(yōu)化階段的重要性也并不相同。若損失函數(shù)無法顯式刻畫這些結(jié)構(gòu)特征,模型在長期預(yù)測中出現(xiàn)系統(tǒng)性偏差便并非偶然,而是訓(xùn)練階段錯誤假設(shè)的自然結(jié)果。

      正是在這一背景下,林宙辰團(tuán)隊提出了題為《Quadratic Direct Forecast for Training Multi-step Time-Series Forecast Models》的研究工作。通過重構(gòu)訓(xùn)練目標(biāo)的加權(quán)結(jié)構(gòu),引入對預(yù)測步相關(guān)性與不確定性差異的顯式建模。研究團(tuán)隊展示了在不改變模型架構(gòu)的前提下,僅通過調(diào)整訓(xùn)練目標(biāo)即可顯著改善多步預(yù)測性能的可能性,從而為時間序列預(yù)測提供了一種從訓(xùn)練機制層面理解長期預(yù)測失效的新視角。


      論文鏈接:https://arxiv.org/pdf/2511.00053v1

      問題根源:均方誤差的兩個先驗

      在當(dāng)下的時序預(yù)測領(lǐng)域,絕大多數(shù)文獻(xiàn)仍以逐時間點的均方誤差(MSE)作為損失函數(shù):

      $$mathcal{L}_{text{MSE}} = |mathbf{y} - g_theta(mathbf{x})|^2=sum_{t=1}^mathrm{T}left(y_t-g_{theta,t}(mathbf{x})right)$$

      這個損失函數(shù)隱含了兩個先驗:1. 未來不同時間點的預(yù)測是相互獨立的;2. 所有預(yù)測步的重要性是相同的。

      然而,現(xiàn)實并非如此:明天的天氣與后天的天氣存在相關(guān)性,預(yù)測未來1小時和1周的難度也完全不同。因此,多步預(yù)測并非一組獨立的回歸任務(wù);不同預(yù)測步在優(yōu)化階段的重要性也并不相同。如損失函數(shù)無法正確刻畫這些結(jié)構(gòu)特征,模型在長期預(yù)測中出現(xiàn)系統(tǒng)性偏差,就并非偶然,而是訓(xùn)練階段錯誤假設(shè)的必然結(jié)果。


      研究人員上述兩點先驗進(jìn)行了實驗檢驗,發(fā)現(xiàn)它們在多步預(yù)測場景中均不成立。

      首先,對標(biāo)簽序列的條件協(xié)方差進(jìn)行了偏相關(guān)分析,以刻畫在控制歷史輸入的影響之后,標(biāo)簽序列不同時間點 $Y_t$ 與 $Y_{t'}$ 之間的直接關(guān)系。實驗結(jié)果顯示,未來時間點之間存在大量非零偏相關(guān)系數(shù),否定了均方誤差所隱含的條件獨立假設(shè)。雷峰網(wǎng)

      進(jìn)一步,對標(biāo)簽序列的條件方差進(jìn)行了分析。實驗結(jié)果顯示,不同時間點的誤差方差存在顯著差異,且隨著預(yù)測步整體增大,說明將所有預(yù)測步視為難度一致的任務(wù)并不符合數(shù)據(jù)特性,否定了均方誤差隱含重要性一致假設(shè)。

      QDF:從數(shù)據(jù)中自適應(yīng)學(xué)習(xí)預(yù)測損失

      針對MSE存在的兩個不合理先驗,林宙辰教授團(tuán)隊提出了QDF(Quadratic Direct Forecast)方法,核心創(chuàng)新在于:不再將損失函數(shù)視為固定不變的優(yōu)化目標(biāo),而是將其本身作為可學(xué)習(xí)的對象,從而自動“發(fā)現(xiàn)”最適合特定任務(wù)數(shù)據(jù)結(jié)構(gòu)的損失表述。

      從概率建模的視角出發(fā),理想的損失函數(shù)應(yīng)來源于負(fù)對數(shù)似然。在高斯誤差假設(shè)下。在高斯誤差假設(shè)下,給定歷史序列 $mathbf{x}$,標(biāo)簽序列 $$mathbf{y}inmathbb{R}^mathrm{Ttimes 1}$$ 的條件分布為多元高斯分布,其負(fù)對數(shù)似然(忽略常數(shù)項)可表示為:

      $$mathcal{L}_{boldsymbol{Sigma}}(mathbf{x},mathbf{y};g_theta) = (mathbf{y} - g_theta(mathbf{x}))^top boldsymbol{bar{Sigma}} (mathbf{y} - g_theta(mathbf{x}))$$

      其中,$boldsymbol{Sigma} in mathbb{R}^{T times T}$是標(biāo)簽序列的條件協(xié)方差矩陣,$T$ 為預(yù)測步長,$boldsymbol{bar{Sigma}} = boldsymbol{Sigma}^{-1}$為該二次型的權(quán)重矩陣。在該二次型中:權(quán)重矩陣的非對角元素刻畫了未來不同時間點之間的條件相關(guān)性,從而能夠顯式建模標(biāo)簽自相關(guān)效應(yīng),打破了MSE所隱含的條件獨立假設(shè);權(quán)重矩陣的對角元素反映了不同預(yù)測步的不確定性差異,使得模型能夠為不同難度的預(yù)測任務(wù)分配異構(gòu)權(quán)重,打破了MSE所隱含的重要性一致假設(shè)。雷峰網(wǎng)

      因此,該二次型損失函數(shù)在理論上能夠同時解決傳統(tǒng)MSE損失在多步預(yù)測場景下的兩個結(jié)構(gòu)性偏差問題。

      然而,在實際預(yù)測任務(wù)中,權(quán)重矩陣$boldsymbol{bar{Sigma}}$難以估計。為解決這一問題,研究團(tuán)隊受到元學(xué)習(xí)啟發(fā),將$boldsymbol{bar{Sigma}}$作為可學(xué)習(xí)的對象,通過一個雙層優(yōu)化機制將$boldsymbol{bar{Sigma}}$從數(shù)據(jù)中“學(xué)”出來:

      $$min_{boldsymbol{Sigma} succeq 0} mathcal{L}_{boldsymbol{Sigma}}(mathbf{x}_{text{out}}, mathbf{y}_{text{out}};g_{theta^*}) quad text{s.t.} quad theta^* = argmin_{theta} mathcal{L}_{boldsymbol{Sigma}}(mathbf{x}_{text{in}}, mathbf{y}_{text{in}};g_theta)$$

      該雙層優(yōu)化問題的求解過程包括兩個階段。首先,在給定$boldsymbol{Sigma}$ 的條件下,通過在元訓(xùn)練集$(mathbf{x}_{text{in}}, mathbf{y}_{text{in}})$上最小化損失函數(shù)$mathcal{L}_{boldsymbol{Sigma}}$來更新模型參數(shù)$theta$。接著,依據(jù)模型在元驗證集$(mathbf{x}_{text{out}}, mathbf{y}_{text{out}})$上的預(yù)測誤差,反向傳播更新$boldsymbol{Sigma}$。其中,元訓(xùn)練集和元驗證集來自對訓(xùn)練集的不同切片。

      這種雙層設(shè)計的核心優(yōu)勢在于:訓(xùn)練目標(biāo)的優(yōu)劣不再由擬合優(yōu)度決定,而是由元驗證集上的泛化性能來刻畫。通過多次數(shù)據(jù)拆分與迭代更新,算法得以學(xué)習(xí)到在不同時間區(qū)間內(nèi)一致的誤差相關(guān)模式,從而形成穩(wěn)定且可泛化的訓(xùn)練目標(biāo)。

      在大量實驗中,一致驗證優(yōu)勢

      論文首先將 QDF 與現(xiàn)有損失函數(shù)進(jìn)行了比較,包括通過標(biāo)簽變換削弱標(biāo)簽相關(guān)性的 FreDF 和 Time-o1。這些方法相較于均方誤差均能帶來一定的性能提升,但在穩(wěn)定性和性能上限方面仍不及 QDF。原因在于這些方法僅部分處理標(biāo)簽之間的相關(guān)性,仍隱含地假設(shè)剩余誤差可通過均勻加權(quán)方式進(jìn)行優(yōu)化,而 QDF 同時建模了標(biāo)簽間的相關(guān)性以及不同預(yù)測步的不確定性,并通過元學(xué)習(xí)得到最優(yōu)加權(quán)權(quán)重,徹底解決了損失函數(shù)中可能存在的偏差。


      其次,研究人員通過消融實驗對上述兩個關(guān)鍵因素進(jìn)行了驗證。實驗分別考察僅建模不同預(yù)測步權(quán)重、僅建模時間相關(guān)性以及同時建模二者的情形。結(jié)果顯示,兩種因素單獨引入時均能帶來性能提升,而二者同時作用時效果最為顯著。


      研究人員也對模型輸出的預(yù)測序列進(jìn)行了可視化分析。結(jié)果表明,基于均方誤差訓(xùn)練的模型在周期性時間序列中普遍存在振幅壓縮、峰值被抹平以及拐點響應(yīng)滯后的現(xiàn)象。引入QDF后,模型在峰值位置、周期相位以及長期趨勢穩(wěn)定性方面均表現(xiàn)出更高一致性,時間結(jié)構(gòu)得到了更完整的保留,說明QDF有效訓(xùn)練模型尊重未來不同時間點之間的整體關(guān)系。


      一次針對均方誤差的系統(tǒng)性審判

      從研究意義的角度來看,這項研究首先推翻了一個在時間序列領(lǐng)域長期被默認(rèn)接受的假設(shè):多步預(yù)測可以被視為多個相互獨立且等權(quán)重的回歸任務(wù)。這一假設(shè)在實踐中被廣泛采用,卻缺乏系統(tǒng)性的經(jīng)驗驗證。研究通過嚴(yán)格的概率建模分析與全面的實證檢驗表明,**這一前提假設(shè)在多步預(yù)測場景中并不成立**。

      在此基礎(chǔ)上,研究進(jìn)一步提出了一種新穎的研究方法:將損失函數(shù)本身視為可以被學(xué)習(xí)的對象。不同于傳統(tǒng)通過超參數(shù)調(diào)節(jié)或啟發(fā)式設(shè)計的方式,該研究通過引入結(jié)構(gòu)化的權(quán)重參數(shù)來顯式建模標(biāo)簽間的關(guān)聯(lián)性和不同預(yù)測步的重要性差異,并通過雙層優(yōu)化機制,直接利用未見數(shù)據(jù)上的泛化誤差學(xué)習(xí)權(quán)重參數(shù)。這種設(shè)計使得損失函數(shù)的形式能夠根據(jù)數(shù)據(jù)特性自適應(yīng)地調(diào)整,從而形成既符合統(tǒng)計建模原理又具有良好泛化能力的訓(xùn)練目標(biāo)。

      對于后續(xù)研究而言,該工作所提供的啟示并不局限于具體方法本身,而體現(xiàn)在更一般的研究范式上。其一,研究強調(diào)了對領(lǐng)域內(nèi)默認(rèn)假設(shè)保持持續(xù)審視的重要性;其二,展示了如何從統(tǒng)計建模出發(fā)反推優(yōu)化目標(biāo)的合理形式;其三,為元學(xué)習(xí)思想在時間序列預(yù)測領(lǐng)域的應(yīng)用和發(fā)展提供了理論和實踐參考,展示了如何將元學(xué)習(xí)的思想與領(lǐng)域特定的統(tǒng)計方法有機結(jié)合。

      作者信息

      論文第一作者王浩,現(xiàn)為浙江大學(xué)控制學(xué)院博士研究生,研究方向聚焦于因果推斷、多任務(wù)學(xué)習(xí)技術(shù)及其在大語言模型中的應(yīng)用。2022 年- 2023 年,他曾在螞蟻金服、微軟亞洲研究院科研實習(xí),從事推薦系統(tǒng)理論研究。2025 年起,他在小紅書參加 RedStar 實習(xí)項目,進(jìn)行大語言模型、可信獎勵模型領(lǐng)域的研究工作。


      論文通訊作者林宙辰,現(xiàn)任北京大學(xué)智能學(xué)院、通用人工智能全國重點實驗室教授。他的研究領(lǐng)域包括機器學(xué)習(xí)和數(shù)值優(yōu)化。他已發(fā)表論文360余篇,谷歌學(xué)術(shù)引用超過42,000次。他是IAPR、IEEE、AAIA、CCF和CSIG會士,多次擔(dān)任CVPR、NeurIPS、ICML等會議的Senior Area Chair,現(xiàn)任ICML Board Member。


      參考鏈接:https://zhouchenlin.github.io/

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      張藝謀一生中的三個女人,一個得到愛,一個得到錢,一個一無所有

      張藝謀一生中的三個女人,一個得到愛,一個得到錢,一個一無所有

      小熊侃史
      2026-01-05 10:39:24
      47歲女保姆哭訴:雖然工資9000元,但卻要滿足男雇主一堆要求

      47歲女保姆哭訴:雖然工資9000元,但卻要滿足男雇主一堆要求

      孢木情感
      2026-02-24 10:22:17
      你啥時候意識到錢的重要性?網(wǎng)友:錢能解決85%以上的雞毛蒜皮事

      你啥時候意識到錢的重要性?網(wǎng)友:錢能解決85%以上的雞毛蒜皮事

      帶你感受人間冷暖
      2026-02-23 01:22:30
      丁禹兮“白龍馬”造型引熱議!馬年開年即出圈,這波操作太秀

      丁禹兮“白龍馬”造型引熱議!馬年開年即出圈,這波操作太秀

      黔鄉(xiāng)小姊妹
      2026-02-24 08:26:09
      吳艷妮小露性感腹肌迷人:普通的日子也會有說不清的快樂

      吳艷妮小露性感腹肌迷人:普通的日子也會有說不清的快樂

      懂球帝
      2026-02-24 11:01:05
      中醫(yī):對肝郁脾虛的人來講,麥芽就是最好的藥,沒有之一!

      中醫(yī):對肝郁脾虛的人來講,麥芽就是最好的藥,沒有之一!

      劉哥談體育
      2026-02-23 18:48:19
      72年,周總理受到巨大委屈,毛主席下定論后,總理至死沒解開心結(jié)

      72年,周總理受到巨大委屈,毛主席下定論后,總理至死沒解開心結(jié)

      比利
      2026-02-23 22:22:07
      馬航370憑空消失,一位美國中情局退休特工說出真相,后來被滅口

      馬航370憑空消失,一位美國中情局退休特工說出真相,后來被滅口

      文史達(dá)觀
      2024-08-10 13:53:48
      首秀10+9+3斷!楊瀚森隊友換隊大爆發(fā),10天短工打爆5年1.5億先生

      首秀10+9+3斷!楊瀚森隊友換隊大爆發(fā),10天短工打爆5年1.5億先生

      球盲姐
      2026-02-24 14:19:06
      遼寧開年負(fù)電價就逼近300小時,負(fù)電價肆虐的病根何在?

      遼寧開年負(fù)電價就逼近300小時,負(fù)電價肆虐的病根何在?

      華夏能源網(wǎng)
      2026-02-23 17:48:25
      恭喜!TVB男星帥氣兒子宣布求婚成功!準(zhǔn)兒媳真容曝光!穿校服定終身

      恭喜!TVB男星帥氣兒子宣布求婚成功!準(zhǔn)兒媳真容曝光!穿校服定終身

      我愛追港劇
      2026-02-23 23:42:25
      今晚起,“春城出行”共享電單車將退出昆明主城運營

      今晚起,“春城出行”共享電單車將退出昆明主城運營

      昆明信息港
      2026-02-24 11:45:47
      春晚過去1周,王菲爭議持續(xù)升級!央媒18字一針見血,字字戳心窩

      春晚過去1周,王菲爭議持續(xù)升級!央媒18字一針見血,字字戳心窩

      削桐作琴
      2026-02-23 22:08:55
      驚人一致!99%的男人玩夠女人后,都會默契地做出這3種行為

      驚人一致!99%的男人玩夠女人后,都會默契地做出這3種行為

      朗威談星座
      2026-02-07 15:17:30
      “吃別人的長壽面,是為他擋災(zāi)!”男孩吃光舅舅長壽面,家長被嘲

      “吃別人的長壽面,是為他擋災(zāi)!”男孩吃光舅舅長壽面,家長被嘲

      妍妍教育日記
      2026-02-23 09:25:08
      文班:卡斯?fàn)枌矊幇驳姆朗胤浅3錾?這是我們贏球的關(guān)鍵

      文班:卡斯?fàn)枌矊幇驳姆朗胤浅3錾?這是我們贏球的關(guān)鍵

      北青網(wǎng)-北京青年報
      2026-02-24 14:48:05
      山東四胞胎“冰清玉潔”:勇闖娛樂圈出道失敗,如今成酒吧擦邊女

      山東四胞胎“冰清玉潔”:勇闖娛樂圈出道失敗,如今成酒吧擦邊女

      胖子的勇氣
      2026-02-24 09:57:17
      全部售罄!“沒有一萬塊,我從三亞回不來”

      全部售罄!“沒有一萬塊,我從三亞回不來”

      新浪財經(jīng)
      2026-02-23 16:17:17
      揭秘亞洲最窮國:當(dāng)?shù)嘏泽@人開放,游客秒變土豪,無不想去定居

      揭秘亞洲最窮國:當(dāng)?shù)嘏泽@人開放,游客秒變土豪,無不想去定居

      明天后天大后天
      2026-02-07 11:10:14
      女子假信佛與多位高僧發(fā)生不當(dāng)關(guān)系,秘密錄制5600段視頻。

      女子假信佛與多位高僧發(fā)生不當(dāng)關(guān)系,秘密錄制5600段視頻。

      特約前排觀眾
      2026-02-09 00:05:05
      2026-02-24 15:20:49
      雷峰網(wǎng) incentive-icons
      雷峰網(wǎng)
      關(guān)注智能與未來!
      68578文章數(shù) 656079關(guān)注度
      往期回顧 全部

      科技要聞

      AI顛覆發(fā)展最新犧牲品!IBM跳水重挫超13%

      頭條要聞

      牛彈琴:白宮突然發(fā)了張圖 傷害性不大侮辱性極強

      頭條要聞

      牛彈琴:白宮突然發(fā)了張圖 傷害性不大侮辱性極強

      體育要聞

      蘇翊鳴總結(jié)米蘭征程:我仍是那個熱愛單板滑雪的少年

      娛樂要聞

      楊洋傳遇上緬北劇組 開機就離開劇組?

      財經(jīng)要聞

      縣城消費「限時繁榮」了十天

      汽車要聞

      入門即滿配 威蘭達(dá)AIR版上市 13.78萬元起

      態(tài)度原創(chuàng)

      房產(chǎn)
      教育
      旅游
      藝術(shù)
      手機

      房產(chǎn)要聞

      窗前即地標(biāo)!獨占三亞灣C位 自貿(mào)港總裁行宮亮相

      教育要聞

      孩子從拖延擺爛到班級前10,我開學(xué)前只盯3個細(xì)節(jié),親測有效

      旅游要聞

      “這里是章丘!”春節(jié)文旅創(chuàng)佳績,策馬揚鞭啟新程

      藝術(shù)要聞

      2025年第八屆全國青年美展 | 油畫作品選刊

      手機要聞

      OPPO折疊屏Find N6宣稱“一馬平川”,主打極致平整屏幕

      無障礙瀏覽 進(jìn)入關(guān)懷版