<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      AdaMCoT:讓大模型學會「看題下菜碟」,動態(tài)選擇最佳思考語言

      0
      分享至



      多語言大模型(MLLM)在面對多語言任務時,往往面臨一個選擇難題:是用原來的語言直接回答,還是翻譯成高資源語言去推理?

      實際上,不同的語言在模型內(nèi)部承載著不同的「特長」。比如英語可能邏輯性強,適合科學推理;而中文或印尼語在處理特定文化背景或押韻任務時,可能比英語更具優(yōu)勢。

      如何讓模型在面對不同任務時,自動選擇一條「最順手」的推理路徑?來自新加坡科技研究局(A*STAR)Nancy F. Chen 和 Ai Ti Aw 帶領(lǐng)的研究團隊,攜手新加坡科技設(shè)計大學(SUTD)Roy Ka-Wei Lee 教授團隊共同推出了AdaMCoT(Adaptive Multilingual Chain-of-Thought)框架。AdaMCoT 的核心在于把 「用哪種語言思考」本身當成一個可優(yōu)化的決策變量:通過自適應地在多種語言間路由并組合鏈式思考,再將推理結(jié)果映射回目標語言,從而顯著提升跨語言的事實推理準確性與一致性。該工作已被 AAAI 2026 主軌道接收為 Oral 論文。



      • 論文標題: AdaMCoT: Rethinking Cross-Lingual Factual Reasoning through Adaptive Multilingual Chain-of-Thought
      • 論文鏈接: https://arxiv.org/abs/2501.16154
      • 作者單位: 新加坡 A*STAR Institute for Infocomm Research(I2R)、新加坡科技設(shè)計大學(SUTD)

      研究背景與痛點

      現(xiàn)有的跨語言推理方法通常存在「路徑依賴」:要么不做處理直接推理,容易導致低資源語言的幻覺;要么強制全部轉(zhuǎn)換成英語推理,這在處理需要保留原語言文化韻味或特定語義的任務(如寫詩、雙關(guān)語)時,往往會弄巧成拙。

      核心問題在于:沒有一種單一的語言適合所有的任務。

      為了解決這一問題,研究團隊提出了AdaMCoT框架。與其強制模型「說英語」,不如賦予模型一種自適應的元認知能力。AdaMCoT 能夠根據(jù)輸入問題的特性(是邏輯題、文化題還是常識題),動態(tài)地從候選語言池(Thinking Languages)中「路由」出一條最佳的思維路徑。



      方法與創(chuàng)新:讓模型「換種語言思考」


      AdaMCoT 并不是「先翻譯再回答」,而是引入了一個自適應路由機制(Adaptive Routing):模型會根據(jù)問題特性,選擇是直接用目標語言推理,還是先在英語、中文等「思考語言」中展開鏈式思考,再回到目標語言給出答案。



      1. 雙路徑推理機制

      AdaMCoT 設(shè)計了兩條主要的推理路徑:

      • 跨語言思維鏈(Cross-Lingual CoT):對于與提示語言不適配的任務,模型將綜合考慮主題一致性、語言知識豐富程度等因素,選取一個合適的 “思考語言”。例如面對使用馬來文提問的數(shù)學題,模型可以選擇英文或者中文作為思考語言,利用這些語言豐富的邏輯和知識儲備完成推理步驟,最后將結(jié)果整合回目標語言。
      • 直接生成(Direct Generation):對于模型本身擅長的語言或特定任務(如寫詩、押韻),直接在源語言上進行分析且生成答案,避免跨語言帶來的語義損耗。

      2. 基于獎勵的自適應路由

      為了讓模型「知道」何時該用哪種語言思考,研究團隊引入了一個基于獎勵的微調(diào)機制。利用 GPT-4o 作為獎勵模型(Reward Model),從事實正確性、連貫性和指令遵循度等維度對不同推理路徑生成的答案進行打分。

      在訓練階段,模型只學習那些得高分(分數(shù) ≥ 9)的推理路徑。這種「優(yōu)勝劣汰」的機制使得 AdaMCoT 能夠根據(jù)問題類型自動切換策略。例如,處理科學問題時可能傾向于用英語思考,而處理具有文化特色的問題時則可能保留原語言。

      實驗結(jié)果:全面超越傳統(tǒng)方法


      研究團隊在mTruthfulQA、CrossAlpaca-Eval 2.0、Cross-MMLU 和 Cross-LogiQA等多個多語言基準上評估了 AdaMCoT,涵蓋了 LLaMA 3.1 和 Qwen 2.5 等主流開源模型。



      1. 事實推理能力顯著提升

      在 mTruthfulQA 數(shù)據(jù)集上,LLaMA3.1-8B-AdaMCoT 在 32 種語言中的 31 種上都取得了性能提升。

      • 對于中文,準確率相對原模型提升9.0%;
      • 對于低資源語言如印度尼西亞語,相對提升高達12.7%;
      • 在匈牙利語、葡萄牙語和孟加拉語等語言上,更是實現(xiàn)了超過10%的絕對提升。

      相比之下,傳統(tǒng)的 Prompt 工程方法(如 AutoCAP)和翻譯對齊方法在低資源語言上往往表現(xiàn)不佳,甚至出現(xiàn)倒退。

      2. 跨語言一致性增強

      實驗表明,AdaMCoT 不僅提高了回答的準確率,還顯著增強了跨語言的一致性。這意味著無論用戶用哪種語言提問,模型都能調(diào)用其內(nèi)部最一致的知識庫來回答,減少了「見人說人話,見鬼說鬼話」的幻覺現(xiàn)象 。



      在 mTruthfulQA 數(shù)據(jù)集上的推理路徑選擇分布。大部分情況下,模型優(yōu)先選擇高資源語言(尤其是英語和中文)作為中間推理語種,從而顯著降低錯誤率;其他語種約占 10%,主要用于提升特殊類別問題的回答準確性。

      深度解讀:為什么「換語言思考」有效?


      為了揭示 AdaMCoT 的生效機理,研究團隊利用Logit Lens和UMAP技術(shù)對模型的內(nèi)部狀態(tài)進行了可視化分析。



      1. Logit Lens:透視模型的思考過程

      通過 Logit Lens 分析發(fā)現(xiàn),當模型直接用低資源語言回答復雜問題時,中間層的預測往往充滿噪聲和幻覺。而當 AdaMCoT 引導模型先用英語「思考」時,模型在早期層級就能鎖定正確的事實路徑,最終生成的答案更加自信且準確。



      2. UMAP:語義空間的對齊

      UMAP 可視化顯示,AdaMCoT 成功拉近了不同語言在語義空間中的距離。經(jīng)過微調(diào)后,非英語語言的嵌入向量(Embeddings)顯著向英語中心靠攏。同時并沒有破壞原有的語義結(jié)構(gòu),而是在保持整體分布的前提下,讓多語言在同一空間中更加對齊。 這表明 AdaMCoT 促進了多語言知識在語義層面的深層融合,而非簡單的表面翻譯。

      總結(jié)


      AdaMCoT 提出了一種全新的多語言推理范式:不改變模型參數(shù)規(guī)模,不依賴海量多語言預訓練數(shù)據(jù),僅通過「學會如何選擇思考語言」,就能顯著釋放大模型的跨語言潛能。

      這項工作不僅為提升低資源語言的 AI 性能提供了低成本的高效方案,也為理解大模型的跨語言對齊機制提供了新的視角。隨著 AI 全球化的推進,AdaMCoT 有望成為打破語言隔閡、實現(xiàn)「AI 普惠」的關(guān)鍵技術(shù)之一。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      重大突破!美國發(fā)明世界最小機器人,僅細胞大小,7分錢一個!

      重大突破!美國發(fā)明世界最小機器人,僅細胞大小,7分錢一個!

      徐德文科學頻道
      2025-12-17 21:01:47
      網(wǎng)傳!房貸貼息真要來了!

      網(wǎng)傳!房貸貼息真要來了!

      新浪財經(jīng)
      2025-12-17 00:16:18
      錢再多有什么用?抗癌一年瘦到脫相的49歲劉謙,不還是要認清現(xiàn)實

      錢再多有什么用?抗癌一年瘦到脫相的49歲劉謙,不還是要認清現(xiàn)實

      夢史
      2025-12-11 11:47:15
      上梁不正下梁歪?半個月吳秀波迎兩大噩耗,兒子兩年前疑自絕后路

      上梁不正下梁歪?半個月吳秀波迎兩大噩耗,兒子兩年前疑自絕后路

      素衣讀史
      2025-12-17 14:03:31
      “馬院老師每月多拿一兩千,憑啥?”高校教師吐槽不公,引熱議

      “馬院老師每月多拿一兩千,憑啥?”高校教師吐槽不公,引熱議

      妍妍教育日記
      2025-12-19 18:36:50
      廣州天河官宣周杰倫、薛之謙、蔡依林、時代少年團等53場大型演唱會

      廣州天河官宣周杰倫、薛之謙、蔡依林、時代少年團等53場大型演唱會

      新快報新聞
      2025-12-19 14:55:04
      22歲女生大學畢業(yè)做團播,入職后三觀震碎:維護“大哥”比跳舞重要,想離職發(fā)現(xiàn)違約金高達50萬元

      22歲女生大學畢業(yè)做團播,入職后三觀震碎:維護“大哥”比跳舞重要,想離職發(fā)現(xiàn)違約金高達50萬元

      大風新聞
      2025-12-19 12:36:02
      羽毛球總決賽:女單4強出爐!國羽韓悅0:2被淘汰,王祉怡1人晉級

      羽毛球總決賽:女單4強出爐!國羽韓悅0:2被淘汰,王祉怡1人晉級

      國乒二三事
      2025-12-19 10:22:27
      七絕最出名的十首,每首都有資格入選“壓卷之作”,必須要收藏

      七絕最出名的十首,每首都有資格入選“壓卷之作”,必須要收藏

      長風文史
      2025-12-08 10:55:02
      “澳門王”何賢簡介

      “澳門王”何賢簡介

      方圓文史
      2025-12-19 09:04:18
      冬天這菜使勁吃!一助睡眠,二降肝火,三可排毒,鮮嫩爽口別錯過

      冬天這菜使勁吃!一助睡眠,二降肝火,三可排毒,鮮嫩爽口別錯過

      秀廚娘
      2025-12-17 19:43:07
      太難了!東莞一工廠發(fā)新員工工資核算標準,入職滿一月僅92元一天

      太難了!東莞一工廠發(fā)新員工工資核算標準,入職滿一月僅92元一天

      火山詩話
      2025-12-15 03:50:34
      耐克公司盤前股價暴跌10.4%

      耐克公司盤前股價暴跌10.4%

      每日經(jīng)濟新聞
      2025-12-19 17:17:28
      看“宋佳”的穿搭,我悟了:羽絨服不配半身裙、高跟鞋,才更高級

      看“宋佳”的穿搭,我悟了:羽絨服不配半身裙、高跟鞋,才更高級

      蓓小西
      2025-12-18 10:01:10
      愛潑斯坦蘿莉島房間內(nèi)部首次曝光,牙醫(yī)椅子、詭異面具……還有多少秘密,誰最著急?

      愛潑斯坦蘿莉島房間內(nèi)部首次曝光,牙醫(yī)椅子、詭異面具……還有多少秘密,誰最著急?

      新民周刊
      2025-12-05 10:03:22
      日本球迷熱議U15東亞杯:看了比賽,中國球員是有潛力的!

      日本球迷熱議U15東亞杯:看了比賽,中國球員是有潛力的!

      邱澤云
      2025-12-19 15:19:00
      王雷李小萌露餡!出席活動冷臉互不理睬 原來恩愛只是“遮羞布”

      王雷李小萌露餡!出席活動冷臉互不理睬 原來恩愛只是“遮羞布”

      好賢觀史記
      2025-12-18 12:44:59
      回國后我才敢說:越南是我去過的所有國家中,最被低估的

      回國后我才敢說:越南是我去過的所有國家中,最被低估的

      李健政觀察
      2025-12-18 09:49:21
      與南京博物院《江南春》有關(guān)的陸挺是誰

      與南京博物院《江南春》有關(guān)的陸挺是誰

      戶外小阿隋
      2025-12-19 08:05:02
      暴雷!2.7億年薪打工皇帝,恒大“二號人物”夏海鈞被最后通牒!

      暴雷!2.7億年薪打工皇帝,恒大“二號人物”夏海鈞被最后通牒!

      歷史偉人錄
      2025-12-16 11:21:40
      2025-12-19 21:27:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業(yè)的人工智能媒體
      11957文章數(shù) 142513關(guān)注度
      往期回顧 全部

      教育要聞

      【精彩花絮】中職大賽丨評委視角看大賽

      頭條要聞

      美方"國防授權(quán)法案"塞入涉臺錯誤內(nèi)容 國臺辦回應

      頭條要聞

      美方"國防授權(quán)法案"塞入涉臺錯誤內(nèi)容 國臺辦回應

      體育要聞

      “惡龍”埃托奧,正在毀滅喀麥隆足球

      娛樂要聞

      曲協(xié)表態(tài)僅6天,郭德綱擔心的事還是發(fā)生

      財經(jīng)要聞

      日元加息,恐慌來了?貨幣三國殺

      科技要聞

      許四清:具身智能的"ChatGPT時刻"還未到來

      汽車要聞

      “一體壓鑄”再引熱議 一旦受損真的修不起嗎?

      態(tài)度原創(chuàng)

      時尚
      健康
      數(shù)碼
      教育
      公開課

      今日熱點:曾艷芬提醒絲芭傳媒有聊天記錄;邊伯賢惡評者被罰款……

      這些新療法,讓化療不再那么痛苦

      數(shù)碼要聞

      宏碁暗影騎士?龍7游戲本發(fā)布:銳龍7 260 + RTX 5060

      教育要聞

      華南理工倡議:校內(nèi)錯峰出行、錯峰用餐,禮讓考研學子

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 亚洲va中文在线播放免费| 亚洲午夜精品国产电影在线观看| 尹人香蕉久久99天天拍| 中文字幕日本人妻| 国产九九在线| 痉挛高潮喷水av无码免费| 当雄县| 中文字幕av一区二区三区人妻少妇| 久久99久国产精品66| 艳妇臀荡乳欲伦69调教视频| 免费无码高H视频在线观看| 美女91社| 狠狠?亚洲?一区| 91精品国产综合久久久不打电影| 国产成人无码网站m3u8| 日韩在线视频观看免费网站| 九九热色| 久久精品国产亚洲7777| 奇米影视7777久久精品| 无遮挡很爽很污很黄的网站 | 丰腴浓毛粗壮熟女X66AV| 无遮挡粉嫩小泬久久久久久久| 久久伊人五月天| 亚洲中文无码一区| 性色av无码久久一区二区三区| 亚洲成av| 亚洲AV无码破坏版在线观看| 亚洲国产无套无码av电影| 国产黄在线观看| 精品久久久久久无码国产| 风韵丰满熟妇啪啪区老熟熟女 | 久爱av| 永久无码天堂网小说区| 窝窝午夜色视频国产精品破| 久久er99热精品一区二区| 婷婷久香综合在线| 亚洲成a人v欧美综合天堂| 日韩人妻精品中文字幕专区不卡| 亚洲色无码国产精品网站可下载| 久久国模吧| 丁香六月婷婷久久综合|