<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      上交聯合UCSD突破LLM推理瓶頸,模型代碼全開源

      0
      分享至



      在大語言模型(LLM)落地應用中,推理速度始終是制約效率的核心瓶頸。傳統自回歸(AR)解碼雖能保證生成質量,卻需逐 token 串行計算,速度極為緩慢;擴散型 LLM(dLLMs)雖支持并行解碼,卻面臨訓練成本高昂、質量下降及 KV 緩存兼容問題;投機解碼(Speculative Decoding)則需額外引入草稿模型,系統復雜度大增。





      Jacobi Forcing Model 與 AR LLM 推理速度對比示意

      近期,來自 UCSD Hao AI Lab 和上海交大 Deng Lab 的團隊提出了一種突破性解決方案 ——Jacobi Forcing,該方案無需重構模型架構,即可將標準 AR 模型轉化為原生因果并行解碼器,在編碼、數學等任務中實現最高 4 倍 wall-clock 提速和 4.5 倍 tokens-per-forward 提升,同時保持接近 AR 模型的生成質量,為 LLM 高效推理開辟了新路徑。



      • 論文地址: https://arxiv.org/pdf/2512.14681
      • 代碼地址:https://github.com/hao-ai-lab/JacobiForcing
      • 模型倉庫:http://huggingface.co/JacobiForcing

      Jacobi Forcing 核心優勢:

      破解并行解碼的 "三元悖論"

      Jacobi Forcing 的創新之處在于打破了 "低代價、高速度、高質量" 的不可能三角,其核心優勢體現在三大維度:

      1. 原生因果架構,部署與訓練成本低:

      不同于 dLLMs 的雙向注意力機制,Jacobi Forcing 保留了 AR 模型的因果注意力結構,完美適配現有 KV 緩存復用機制和 AR 優化內核,可作為現有 AR 模型的 "即插即用" 替代方案,極大降低部署與訓練成本。

      2. 高效并行解碼,速度提升顯著:

      通過在模型自己生成的 Jacobi 解碼軌跡做漸進蒸餾訓練,模型能夠快速在每輪前向傳播中并行更新多個 token。結合多塊并行解碼(Multiblock decoding)和拒絕回收(Rejection recycling)策略,可同時維護多個解碼塊,緩存高質量 n-gram 片段重復利用,在編碼任務中實現 181.8 TPS 的生成速度,遠超 AR 基線的 39.8 TPS。

      3. 質量損失極小,任務表現優異:

      針對 AR 到擴散模型的預訓練 - 后訓練目標不匹配問題,Jacobi Forcing 設計了使用模型自己生成的數據做學習,通過漸進式一致性蒸餾損失和 AR 損失的聯合優化,讓模型在噪聲環境下仍能生成貼近 AR 分布的高質量結果,學習高效且保持了 AR 模型的高質量特性。在 HumanEval 編碼基準中,以 83.5% 的準確率實現 4 倍提速;在 GSM8K 數學任務中,91.4% 的解題率接近 AR 基線,速度提升 3.7 倍。



      Jacobi Forcing 與 dllm 在速度,質量與訓練成本上的對比圖

      Jacobi Forcing 技術路線:

      從訓練到推理的全鏈路優化


      Jacobi Forcing 以因果并行解碼為核心目標,基于 Jacobi 解碼框架進行深度優化,通過訓練機制創新與推理策略升級的全鏈路設計,在保留 AR 模型因果骨干與 KV 緩存兼容性的同時,實現高效并行解碼。

      其技術路線具體細節如下:

      1. 技術基礎:基于 Jacobi 解碼的因果并行框架

      Jacobi 解碼是一種因果并行解碼過程,核心邏輯是:在保留 AR 模型因果注意力機制的前提下,對一個塊內的所有 token 進行并行迭代更新,直到所有 token 與貪心 AR 輸出完全匹配(即達到 “定點” 狀態)。這一過程形成了一條 “并行精煉軌跡”,既維持了因果依賴關系,又突破了逐 token 串行的限制。 此前的相關工作(如 CLLMs)已驗證:通過在 Jacobi 軌跡上微調模型,可縮短迭代軌跡、提升解碼速度,但存在一個關鍵局限:在大 block size 下由于上文噪聲過多無法并行解碼出更多的 token 數。Jacobi Forcing 在此基礎上進一步推進,核心突破是:訓練模型在含噪聲的上文下,仍能生成貼近 AR 分布的高質量草稿,同時通過推理策略優化,最大化并行效率。

      2. 訓練階段優化:噪聲感知的漸進式學習

      Jacobi Forcing 首先利用自回歸語言模型對提示詞(prompt)集合執行 Jacobi 解碼,采集從噪聲塊到干凈定點的完整 Jacobi 解碼軌跡。為使模型具備應對高噪聲上文場景下的并行解碼能力,Jacobi Forcing 設計漸進式噪聲調度策略,以學習噪聲塊到干凈定點的映射關系:具體而言,先為采集軌跡中的中間未收斂噪聲塊賦予噪聲等級(噪聲等級越高,與干凈定點狀態的偏差越大),再按 “低噪聲→高噪聲” 的漸進式順序對噪聲塊進行打包,構建訓練序列,從而提升去噪任務的可學習性;其核心訓練目標為將打包后的含噪聲訓練序列映射至全干凈定點序列。為實現高效訓練,Jacobi Forcing 進一步設計噪聲感知注意力掩碼,該掩碼支持通過單次模型前向傳播即可完成上述映射關系的學習。此外,為平衡并行解碼效率與自回歸(AR)生成質量,方案設計了加權雙項聯合損失函數:其一為漸進式一致性蒸餾損失,用于引導模型掌握任意噪聲等級塊到干凈定點塊的映射;其二為 AR 損失,確保模型生成質量與原始自回歸模型保持一致。



      訓練數據打包與噪聲感知注意力掩碼圖解

      3. 推理階段優化:高效并行解碼策略

      訓練后的 Jacobi Forcing 模型仍是標準 AR checkpoint,但通過針對性的推理策略,可最大化并行解碼效率,核心包括 “高質量草稿利用 + 多塊調度” 兩大模塊。

      1.高質量草稿挖掘與復用:訓練后模型的 Jacobi 解碼軌跡呈現顯著特性:軌跡中未收斂點包含大量高質量 n-gram,這些 n-gram 雖可能位置暫錯,但內容與最終 AR 定點輸出完全一致,且在迭代中保持穩定。基于此特性,推理時會緩存 n-gram 并在后續迭代中直接將這些緩存的 n-gram 作為候選草稿,減少迭代次數(見下圖軌跡可視化:紅色標注為可復用的高質量 n-gram)。



      高質量草稿復用圖解

      2.多塊并行調度: 同時維護 K 個塊(實驗中 K=2 為最優),分為 “真實活躍塊” 和 “偽活躍塊”; 真實活躍塊中的 token 會被驗證并提交到 KV 緩存,成為后續塊的因果前綴;偽活躍塊會基于當前前綴進行 Jacobi 迭代更新,但暫不提交到 KV 緩存; 當真實活躍塊收斂(所有 token 匹配定點),從偽活躍塊中選擇一個晉升為真實活躍塊,基于更新后的完整前綴重新驗證其所有 token。



      推理階段優化策略圖解

      實測表現:優于主流并行解碼方案

      在 A100 GPU 上的 7B 模型基準測試中,Jacobi Forcing 超越 dLLMs、投機解碼等主流方案,展現出更優的速度 - 質量 trade-off。



      Jacobi Forcing 模型性能展示

      無論是編碼、數學等專業任務,還是通用文本生成場景,Jacobi Forcing 都能在保證結果可靠性的前提下,將推理速度提升一個量級,尤其適合對延遲敏感的工業級 LLM 應用。

      Jacobi Forcing 的出現,不僅解決了 LLM 推理的效率瓶頸,更重新定義了因果模型的并行化可能。隨著大模型應用向低延遲、高并發場景滲透,這種兼顧兼容性、高性能和高質量的解碼方案,有望成為工業級 LLM 部署的首選技術,推動 AI 應用效率邁入新階段。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      浙江女孩愛上西班牙小伙,未婚懷胎8月,連同男友遭婆家哥嫂殺害

      浙江女孩愛上西班牙小伙,未婚懷胎8月,連同男友遭婆家哥嫂殺害

      觀察鑒娛
      2025-12-30 09:48:21
      不冤!龐家指定發聲媒體《亞洲周刊》被禁真相

      不冤!龐家指定發聲媒體《亞洲周刊》被禁真相

      解鎖世界風云
      2025-12-30 10:54:45
      潛在歸化!巴西20歲中鋒將登陸中超,下家2選1,5年后望進國足

      潛在歸化!巴西20歲中鋒將登陸中超,下家2選1,5年后望進國足

      體壇鑒春秋
      2025-12-30 17:05:34
      委內瑞拉:摧毀8架飛機、4個營地

      委內瑞拉:摧毀8架飛機、4個營地

      參考消息
      2025-12-30 14:25:56
      泡泡瑪特開始五折甩賣,二手平臺上Labubu部分款式跌破原價,部分黃牛公開聲明“暫緩收購Labubu系列”

      泡泡瑪特開始五折甩賣,二手平臺上Labubu部分款式跌破原價,部分黃牛公開聲明“暫緩收購Labubu系列”

      極目新聞
      2025-12-29 19:54:13
      年齡將不再是“免罪金牌” 新法來了!明年1月1日起 14周歲以上未成年人、70周歲以上老年人也可能被行政拘留!

      年齡將不再是“免罪金牌” 新法來了!明年1月1日起 14周歲以上未成年人、70周歲以上老年人也可能被行政拘留!

      觀威海
      2025-12-29 14:26:07
      美烏峰會純粹是表演,烏情報局長稱“世界并非都為烏克蘭而活”

      美烏峰會純粹是表演,烏情報局長稱“世界并非都為烏克蘭而活”

      山河路口
      2025-12-29 18:53:19
      時機已到,大陸開始收網,2道通緝令發往臺島,臺當局后果自負

      時機已到,大陸開始收網,2道通緝令發往臺島,臺當局后果自負

      今日美食分享
      2025-12-30 09:49:23
      結果出爐,連勝武獲勝,四藍委落敗,鄭麗文拋重磅,侯友宜尷尬

      結果出爐,連勝武獲勝,四藍委落敗,鄭麗文拋重磅,侯友宜尷尬

      說歷史的老牢
      2025-12-29 11:37:15
      29萬人逃離湖南,22萬人離開吉林!人口大遷徙中,誰是最后贏家?

      29萬人逃離湖南,22萬人離開吉林!人口大遷徙中,誰是最后贏家?

      單手搓核彈
      2025-12-30 13:59:55
      “斬殺線” 折射出美國社會什么問題?

      “斬殺線” 折射出美國社會什么問題?

      看看新聞Knews
      2025-12-29 16:09:02
      唐嫣無劉海生圖出圈!額頭細紋太真實,網友卻狂夸好看

      唐嫣無劉海生圖出圈!額頭細紋太真實,網友卻狂夸好看

      章眽八卦
      2025-12-30 12:26:28
      生涯400次30+有多難?僅7人做到,杜蘭特419次第七,三人超500次

      生涯400次30+有多難?僅7人做到,杜蘭特419次第七,三人超500次

      你的籃球頻道
      2025-12-30 12:27:40
      35歲金晨近照曝光翻車了!腫脹的像發面饅頭,越來越像網紅了

      35歲金晨近照曝光翻車了!腫脹的像發面饅頭,越來越像網紅了

      娛圈小愚
      2025-12-30 14:06:32
      元旦,別再說“元旦快樂”,太土!試試這20句,一看就是文化人

      元旦,別再說“元旦快樂”,太土!試試這20句,一看就是文化人

      狼小妖
      2025-12-27 00:13:54
      NBA西部最新積分榜:雷霆28勝領跑,刺掘連敗,火箭第4,勇士第8

      NBA西部最新積分榜:雷霆28勝領跑,刺掘連敗,火箭第4,勇士第8

      薇說體育
      2025-12-30 17:05:46
      云盡孝8年后:她被加拿大市長拋棄,樣貌大變,遇到國人慌忙躲避

      云盡孝8年后:她被加拿大市長拋棄,樣貌大變,遇到國人慌忙躲避

      歸客歷史
      2025-12-29 09:03:35
      特斯拉“車頂維權”女車主被限高,此前被索賠500萬被判賠17萬

      特斯拉“車頂維權”女車主被限高,此前被索賠500萬被判賠17萬

      封面新聞
      2025-12-30 09:57:14
      “最佳血壓”是多少?醫生建議:過76歲以后,血壓最好控制這范圍

      “最佳血壓”是多少?醫生建議:過76歲以后,血壓最好控制這范圍

      華庭講美食
      2025-12-29 16:12:05
      凌晨4點 英超天王山之戰:13億阿森納大戰11連勝黑馬 曼城嗑瓜子

      凌晨4點 英超天王山之戰:13億阿森納大戰11連勝黑馬 曼城嗑瓜子

      風過鄉
      2025-12-30 06:47:54
      2025-12-30 17:43:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12022文章數 142523關注度
      往期回顧 全部

      科技要聞

      估值150億的智元,開始批量"制造"小獨角獸

      頭條要聞

      臺軍承認:解放軍的五大演習區域都進入臺灣"12海里"

      頭條要聞

      臺軍承認:解放軍的五大演習區域都進入臺灣"12海里"

      體育要聞

      這個59歲的胖子,還在表演“蝎子擺尾”

      娛樂要聞

      林俊杰女友被扒 父親涉經濟案卷款13億?

      財經要聞

      朱光耀:美關稅政策正使WTO名存實亡

      汽車要聞

      標配華為乾崑ADS 4 Pro 華境S明年上半年上市

      態度原創

      家居
      房產
      健康
      游戲
      公開課

      家居要聞

      當歸之宅 三胎圓滿居所

      房產要聞

      瘋了!2025海南拿地榜巨變:榜首狂砸80億,民企火力全開!

      這些新療法,讓化療不再那么痛苦

      《仙劍四重制版》實機播放破200萬!回合制原因揭秘

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 丰满人妻妇伦又伦精品国产| 广南县| 亚洲色欲色欲天天天www| 少妇人妻偷人精品无码视频新浪| 91少妇| xxxx欧美| 祁东县| 秋霞av鲁丝片一区二区| 丰满人妻妇伦又伦精品国产| 色国产视频| 国产精品第八页| 东京热无码av男人的天堂| 日韩中文字幕区一区有砖一区| 野花韩国高清电影| 亚洲啊v.在线播放| 日韩人妻无码网站| 国产成人精品午夜福利 | 亚洲成a人片在线观看天堂无码| 亚洲综合天堂一区二区三区| 韩日一级| 国产成人?综合?亚洲| 无尺码精品产品视频| 亚洲av影院一区二区三区| 亚洲成人黄色| 人妻?综合?无码?另类| 国产a∨精品一区二区三区不卡| 亚洲精品欧美综合二区| 国产av日韩av| 亚洲成a人片在线观看无码| 妖精色av无码国产在线看| 国产91精品调教在线播放| 国产小仙女一区二区三区| 97人妻精品无码| 99精品无码一区二区| 亚洲最大成人av在线天堂网| 久久伊人五月天| 特级av毛片免费观看| 好紧好湿好爽免费视频| 欧美亚韩一区二区三区| 宜丰县| 无限看片在线版免费视频大全|