<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      中科院計算所團隊讓多語言能力「外掛式」加載

      0
      分享至



      XBridge 能夠將 LLM 低資源語言甚至未見語言的理解和生成能力提升到接近組合的 NMT 模型的水平,在下游任務上顯著縮小高資源、低資源語言間性能差距,同時保持或提升高資源語言能力,全程無需訓練 LLM。

      近年來,大語言模型(LLM)在通用問答與復雜推理任務上表現優異。然而在多語言場景下,LLM 則表現出明顯的不均衡:在英語等少數高資源語言上表現優異,在低資源和未見語言上則不穩定或難以支持。

      一個直觀的解釋是訓練數據不足,但更本質的問題在于表示空間不匹配。已有研究表明,LLM 已經在統一的語義空間中編碼了豐富的跨語言知識,并且在處理多語言文本時會專門「經過」這個統一語義空間(如英語表示空間)。這意味著,LLM 的多語言瓶頸不在缺乏知識,而是難以將已有的知識正確映射到多語言表示空間中

      與此同時,多語言神經機器翻譯(NMT)模型在跨語言表示建模方面表現出色。這些 NMT 模型通過 encoder-decoder 架構構建了一個統一的跨語言語義空間,實現上百種語言之間穩定的語義轉換。這啟發我們:能否將 LLM 的知識處理能力和多語言 NMT 模型的多語言能力組合,實現優勢互補?

      基于這一思路,中國科學院計算技術研究所 NLP 團隊提出了一種新的多語言擴展范式 XBridge:組合 LLM 以英文為中心的通用能力,以及現有多語言 NMT 模型的多語言理解和生成能力,實現二者的能力互補,組合成一個多語言通用模型。換言之,將多語言理解和生成卸載到外部 NMT 模型,LLM 進行以英文為中心的通用知識處理



      • 論文:https://arxiv.org/abs/2603.17512
      • 代碼:https://github.com/ictnlp/XBridge
      • 模型:https://huggingface.co/collections/ICTNLP/xbridge

      該成果已被 ACL 2026 主會接收。

      XBridge:模型組合的多語言擴展方案

      XBridge 的核心思想是,將多語言能力卸載到 NMT 模型,同時保留 LLM 作為知識處理和推理的核心。



      1. 模型架構

      XBridge 采用 encoder-LLM-decoder 三段式架構,模塊之間用 MLP 架構的輕量映射層連接:

      • NMT encoder:將多語言輸入映射到共享語義空間。
      • LLM:以英語為中心的知識處理和推理核心。
      • NMT decoder:生成目標語言輸出。

      直觀來看,多語言輸入首先被 encoder 編碼成共享語義表示,再由 LLM 進行知識處理和推理,最后 decoder 映射到目標語言輸出,實現完整的多語言「理解 - 處理 - 生成」閉環。

      2. 最優運輸對齊

      由于不同模型之間的表示空間天然不一致,例如 token 粒度上嚴重錯位,單純利用 MLP 進行跨模型表示映射難以實現語義一致的轉換。為解決這一問題,我們引入最優運輸(Optimal Transport, OT)對齊目標,自適應地學習 token 粒度的軟匹配,從而在不同長度、不同分詞方式的異構表示空間之間建立細粒度的語義對齊關系,實現穩定的語義轉換和高質量的多語言生成。

      3. 三階段訓練策略

      為在不同模型之間建立穩定對齊,XBridge 設計三階段訓練策略,LLM 全程無需訓練

      • 跨模型對齊階段:學習 encoder-LLM-decoder 之間的基礎語義映射關系。
      • 編碼器適配階段:讓 LLM 學會利用 encoder 表示完成下游任務。
      • 解碼器適配階段:進一步提升 decoder 多語言生成質量。

      分階段的訓練設計能夠有效避免不同優化目標之間的沖突,使模型能夠逐步建立穩定的跨模型映射,并適配下游任務。

      實驗結果:

      不訓練 LLM 即可支持高質量未見語言問答

      1. 多語言能力成功卸載到 NMT 模型

      在 FLORES-101 翻譯任務上,XBridge 顯著提升了 LLM 在低資源語言或未見語言(如孟加拉語、斯瓦西里語等)上的理解和生成能力,性能接近或超越外部 NMT 模型。這表明 LLM 的多語言能力是可以卸載到外部 NMT 模型的。



      2. 下游任務顯著提升

      在多語言數學推理(MGSM)和摘要生成(XL-Sum)任務上,XBridge 在低資源語言上獲得顯著提升,顯著縮小高資源、低資源語言的性能差距,同時保持或提升高資源語言性能。值得注意的是,這個過程不需要訓練 LLM。



      3. 可泛化、語言無關的跨模型映射

      XBridge 在未訓練的語言上仍表現出良好的泛化能力,性能甚至接近外部 NMT 模型,這表明 XBridge 學到的是一種語言無關的跨模型映射。此外,OT 任務對語言生成的泛化具有重要作用。



      4. 可控語言生成與無損語言切換

      通過控制 decoder 輸入語言標簽,XBridge 可以靈活指定輸出語言,實現任意語言對之間的跨語言生成,同時保持無損的多語言切換。



      以下是一個語言切換示例。



      5. 系統演示

      我們借助一階段的泛化性,直接在 50 種語言的通用指令遵循數據上訓練 XBridge。以下是一個 demo,展示了 XBridge 多語言問答能力和語言切換的效果。



      視頻地址:https://mp.weixin.qq.com/s/Ku1dZNIpI93J21d75RYAkg

      總結與展望

      通過將多語言能力卸載到外部 NMT 模型,XBridge 在不訓練 LLM 的前提下,實現了對低資源和未見語言的高質量支持。除了性能的提升,XBridge 更重要的價值在于為 LLM 的多語言擴展提供了一個新思路:擴展 LLM 的多語言能力,或許不再需要依賴大規模、高質量、多任務的多語言訓練數據,而是可以通過組合現有模型,實現低成本擴展。

      作者介紹

      卜夢煜,中國科學院計算技術研究所博士研究生,導師為馮洋研究員。主要研究方向為多語言大模型。在 ACL、EMNLP 等自然語言處理領域頂級國際會議發表多篇論文。

      馮洋,中國科學院院計算技術研究所研究員、博士生導師,擔任國際計算語言學學會執委(ACL Secretary)以及 ACL/EMNLP 等多個國際會議高級領域主席,獲 ACL 2019 唯一最佳長文獎。主導研發了百聆大模型和 LLaMA-Omni 即時交互語音大模型(曾位列 Huggingface 連續一周模型下載量前十)。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      1997年蔣緯國去世的消息轟動臺灣,但不是他的死訊,而是他的遺言

      1997年蔣緯國去世的消息轟動臺灣,但不是他的死訊,而是他的遺言

      浩渺青史
      2026-04-27 16:24:04
      未來10年最吃香的 “鐵飯碗”,這6個行業,抓住一個終身躺贏!

      未來10年最吃香的 “鐵飯碗”,這6個行業,抓住一個終身躺贏!

      細說職場
      2026-04-25 19:55:42
      難怪張柏芝準備壽衣遺照!謝霆鋒不再隱瞞,坦白不娶王菲另有其因

      難怪張柏芝準備壽衣遺照!謝霆鋒不再隱瞞,坦白不娶王菲另有其因

      秋姐居
      2026-04-13 09:58:48
      這是迄今為止,我見過身材最美的女人之一,不接受反駁

      這是迄今為止,我見過身材最美的女人之一,不接受反駁

      小椰的奶奶
      2026-04-11 12:33:07
      哎!居然是跟腱斷裂!!

      哎!居然是跟腱斷裂!!

      柚子說球
      2026-04-27 12:34:08
      第一集就全裸出鏡,女神新劇破格出演了

      第一集就全裸出鏡,女神新劇破格出演了

      來看美劇
      2026-04-27 16:21:10
      謝逸楓:顫抖吧!一季度賣地收入大跌,不足6000億元

      謝逸楓:顫抖吧!一季度賣地收入大跌,不足6000億元

      謝逸楓看樓市
      2026-04-27 09:54:05
      淚目 趙心童曬兒時與丁俊暉合照:偶像暉哥讓我加油 你也要加油啊

      淚目 趙心童曬兒時與丁俊暉合照:偶像暉哥讓我加油 你也要加油啊

      風過鄉
      2026-04-27 06:15:09
      傷得很深!男子打賞女主播近300萬,想結婚時才知對方女兒都20歲了:我只顧為愛沖鋒,結果她全是假話

      傷得很深!男子打賞女主播近300萬,想結婚時才知對方女兒都20歲了:我只顧為愛沖鋒,結果她全是假話

      臺州交通廣播
      2026-04-10 16:23:25
      河南省紀委監委:張文忠被查

      河南省紀委監委:張文忠被查

      濮陽市廣播電視臺
      2026-04-27 19:33:55
      20歲云南小伙迪拜打工遇俄羅斯單親媽媽,跨國求婚卻遭戰火阻隔

      20歲云南小伙迪拜打工遇俄羅斯單親媽媽,跨國求婚卻遭戰火阻隔

      愛寫作的洋洋
      2026-04-18 09:14:07
      國防部長被炸身亡!俄羅斯外交重大損失,關鍵時刻雪上加霜

      國防部長被炸身亡!俄羅斯外交重大損失,關鍵時刻雪上加霜

      Ck的蜜糖
      2026-04-27 18:28:24
      太可怕了!繼注射藥物、熱巴事件后,王陽再揭娛樂圈最臟的一面

      太可怕了!繼注射藥物、熱巴事件后,王陽再揭娛樂圈最臟的一面

      橙星文娛
      2026-04-17 13:19:56
      湖人慘敗火箭回到主場繼續賣票,詹姆斯一數據很不正常,肖華笑了

      湖人慘敗火箭回到主場繼續賣票,詹姆斯一數據很不正常,肖華笑了

      姜大叔侃球
      2026-04-27 12:57:40
      阿里納斯:詹姆斯退役后、媒體再無流量!選他而不是喬丹來建隊!

      阿里納斯:詹姆斯退役后、媒體再無流量!選他而不是喬丹來建隊!

      歷史第一人梅西
      2026-04-27 10:59:36
      4年磨一劍,第二代騰勢D9上市,35.98萬元起售

      4年磨一劍,第二代騰勢D9上市,35.98萬元起售

      一同選車
      2026-04-27 21:24:26
      告別北京老校區!4所211集體遷入雄安,2027年直接迎新生

      告別北京老校區!4所211集體遷入雄安,2027年直接迎新生

      Delete丨CC
      2026-04-27 13:27:06
      核按鈕前的躊躇:為什么俄羅斯寧肯認輸,也不敢按下那個按鈕

      核按鈕前的躊躇:為什么俄羅斯寧肯認輸,也不敢按下那個按鈕

      民間胡扯老哥
      2026-04-26 14:24:18
      多存錢,50歲以后,存款達到“這個數”,你的家庭就很有底氣了!

      多存錢,50歲以后,存款達到“這個數”,你的家庭就很有底氣了!

      貓叔東山再起
      2026-04-27 12:10:07
      剛剛!官方點名張家界天門山、麗江古城、玉龍雪山、黃河壺口瀑布、桂林漓江、嵩山少林寺等景區,嚴肅批評、集中整治!

      剛剛!官方點名張家界天門山、麗江古城、玉龍雪山、黃河壺口瀑布、桂林漓江、嵩山少林寺等景區,嚴肅批評、集中整治!

      揚子晚報
      2026-04-27 16:31:23
      2026-04-27 23:31:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12874文章數 142638關注度
      往期回顧 全部

      科技要聞

      DeepSeek V4上線三天,第一批實測出來了

      頭條要聞

      水庫放水21人被困下游河灘 有人讓家人踩肩頭爬樹避險

      頭條要聞

      水庫放水21人被困下游河灘 有人讓家人踩肩頭爬樹避險

      體育要聞

      最抽象的天才,正在改變瓜迪奧拉

      娛樂要聞

      黃楊鈿甜為“耳環風波”出鏡道歉:謠言已澄清

      財經要聞

      Meta 140億收購Manus遭中國發改委否決

      汽車要聞

      不那么小眾也可以 smart的路會越走越寬

      態度原創

      親子
      房產
      健康
      公開課
      軍事航空

      親子要聞

      教孩子防侵犯誤區:對熟悉的壞人孩子不會害怕和恐懼!

      房產要聞

      信號!海南商業版圖,迎來大變局!

      干細胞如何讓燒燙傷皮膚"再生"?

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      伊朗外長折返伊斯蘭堡內情披露

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲av综合永久无码精品天堂| 亚洲AV激情无码专区在线播放| 亚洲国产精品久久久久婷蜜芽| 久久精品无码精品免费专区| 一本久道久久综合狠狠爱四虎影视| 无码中出人妻| 国产精品青草久久久久福利99| 国产精品毛片av一区二区| 国产av天堂亚洲国产av天堂| 野花3观看免费观看视频| 国产精品无码v在线观看| 精品无码一区二区三区| 天天做天天爱夜夜爽毛片| 精品久久久久中文字幕无码油 | 国产免费无码一区二区| 久久男人av资源网站无码 | 亚洲 欧美 综合 另类 中字| 黄色视频在线观看18| 无码午夜福利片| 中文字幕熟妇人| 亚洲精品成人a?v久久| ..真实国产乱子伦毛片| 久久亚洲精品综合国产仙踪林| 国产福利微视频一区二区| 国产激情视频在线观看首页| 中文字幕aav| 国产办公室秘书无码精品99| 亚洲一区二区三区四区五区六| 株洲市| 国产超碰人人做人人爱ⅴa| 夜福利导航| 亚洲中文无码av永久不收费| 69精品人人人| 色偷偷偷综合中文字幕| 国产午夜一区二区在线观看| 亚洲欧美综合人成在线| 亚洲第一视频区| 99久久夜色精品国产亚洲| 蜜桃av一区二区高潮久久精品| 欧美亚洲日韩精品一卡二卡| 开心五月激情综合婷婷|