<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      AdaMCoT:讓大模型學會「看題下菜碟」,動態選擇最佳思考語言

      0
      分享至



      多語言大模型(MLLM)在面對多語言任務時,往往面臨一個選擇難題:是用原來的語言直接回答,還是翻譯成高資源語言去推理?

      實際上,不同的語言在模型內部承載著不同的「特長」。比如英語可能邏輯性強,適合科學推理;而中文或印尼語在處理特定文化背景或押韻任務時,可能比英語更具優勢。

      如何讓模型在面對不同任務時,自動選擇一條「最順手」的推理路徑?來自新加坡科技研究局(A*STAR)Nancy F. Chen 和 Ai Ti Aw 帶領的研究團隊,攜手新加坡科技設計大學(SUTD)Roy Ka-Wei Lee 教授團隊共同推出了AdaMCoT(Adaptive Multilingual Chain-of-Thought)框架。AdaMCoT 的核心在于把 「用哪種語言思考」本身當成一個可優化的決策變量:通過自適應地在多種語言間路由并組合鏈式思考,再將推理結果映射回目標語言,從而顯著提升跨語言的事實推理準確性與一致性。該工作已被 AAAI 2026 主軌道接收為 Oral 論文。



      • 論文標題: AdaMCoT: Rethinking Cross-Lingual Factual Reasoning through Adaptive Multilingual Chain-of-Thought
      • 論文鏈接: https://arxiv.org/abs/2501.16154
      • 作者單位: 新加坡 A*STAR Institute for Infocomm Research(I2R)、新加坡科技設計大學(SUTD)

      研究背景與痛點

      現有的跨語言推理方法通常存在「路徑依賴」:要么不做處理直接推理,容易導致低資源語言的幻覺;要么強制全部轉換成英語推理,這在處理需要保留原語言文化韻味或特定語義的任務(如寫詩、雙關語)時,往往會弄巧成拙。

      核心問題在于:沒有一種單一的語言適合所有的任務。

      為了解決這一問題,研究團隊提出了AdaMCoT框架。與其強制模型「說英語」,不如賦予模型一種自適應的元認知能力。AdaMCoT 能夠根據輸入問題的特性(是邏輯題、文化題還是常識題),動態地從候選語言池(Thinking Languages)中「路由」出一條最佳的思維路徑。



      方法與創新:讓模型「換種語言思考」


      AdaMCoT 并不是「先翻譯再回答」,而是引入了一個自適應路由機制(Adaptive Routing):模型會根據問題特性,選擇是直接用目標語言推理,還是先在英語、中文等「思考語言」中展開鏈式思考,再回到目標語言給出答案。



      1. 雙路徑推理機制

      AdaMCoT 設計了兩條主要的推理路徑:

      • 跨語言思維鏈(Cross-Lingual CoT):對于與提示語言不適配的任務,模型將綜合考慮主題一致性、語言知識豐富程度等因素,選取一個合適的 “思考語言”。例如面對使用馬來文提問的數學題,模型可以選擇英文或者中文作為思考語言,利用這些語言豐富的邏輯和知識儲備完成推理步驟,最后將結果整合回目標語言。
      • 直接生成(Direct Generation):對于模型本身擅長的語言或特定任務(如寫詩、押韻),直接在源語言上進行分析且生成答案,避免跨語言帶來的語義損耗。

      2. 基于獎勵的自適應路由

      為了讓模型「知道」何時該用哪種語言思考,研究團隊引入了一個基于獎勵的微調機制。利用 GPT-4o 作為獎勵模型(Reward Model),從事實正確性、連貫性和指令遵循度等維度對不同推理路徑生成的答案進行打分。

      在訓練階段,模型只學習那些得高分(分數 ≥ 9)的推理路徑。這種「優勝劣汰」的機制使得 AdaMCoT 能夠根據問題類型自動切換策略。例如,處理科學問題時可能傾向于用英語思考,而處理具有文化特色的問題時則可能保留原語言。

      實驗結果:全面超越傳統方法


      研究團隊在mTruthfulQA、CrossAlpaca-Eval 2.0、Cross-MMLU 和 Cross-LogiQA等多個多語言基準上評估了 AdaMCoT,涵蓋了 LLaMA 3.1 和 Qwen 2.5 等主流開源模型。



      1. 事實推理能力顯著提升

      在 mTruthfulQA 數據集上,LLaMA3.1-8B-AdaMCoT 在 32 種語言中的 31 種上都取得了性能提升。

      • 對于中文,準確率相對原模型提升9.0%;
      • 對于低資源語言如印度尼西亞語,相對提升高達12.7%;
      • 在匈牙利語、葡萄牙語和孟加拉語等語言上,更是實現了超過10%的絕對提升。

      相比之下,傳統的 Prompt 工程方法(如 AutoCAP)和翻譯對齊方法在低資源語言上往往表現不佳,甚至出現倒退。

      2. 跨語言一致性增強

      實驗表明,AdaMCoT 不僅提高了回答的準確率,還顯著增強了跨語言的一致性。這意味著無論用戶用哪種語言提問,模型都能調用其內部最一致的知識庫來回答,減少了「見人說人話,見鬼說鬼話」的幻覺現象 。



      在 mTruthfulQA 數據集上的推理路徑選擇分布。大部分情況下,模型優先選擇高資源語言(尤其是英語和中文)作為中間推理語種,從而顯著降低錯誤率;其他語種約占 10%,主要用于提升特殊類別問題的回答準確性。

      深度解讀:為什么「換語言思考」有效?


      為了揭示 AdaMCoT 的生效機理,研究團隊利用Logit Lens和UMAP技術對模型的內部狀態進行了可視化分析。



      1. Logit Lens:透視模型的思考過程

      通過 Logit Lens 分析發現,當模型直接用低資源語言回答復雜問題時,中間層的預測往往充滿噪聲和幻覺。而當 AdaMCoT 引導模型先用英語「思考」時,模型在早期層級就能鎖定正確的事實路徑,最終生成的答案更加自信且準確。



      2. UMAP:語義空間的對齊

      UMAP 可視化顯示,AdaMCoT 成功拉近了不同語言在語義空間中的距離。經過微調后,非英語語言的嵌入向量(Embeddings)顯著向英語中心靠攏。同時并沒有破壞原有的語義結構,而是在保持整體分布的前提下,讓多語言在同一空間中更加對齊。 這表明 AdaMCoT 促進了多語言知識在語義層面的深層融合,而非簡單的表面翻譯。

      總結


      AdaMCoT 提出了一種全新的多語言推理范式:不改變模型參數規模,不依賴海量多語言預訓練數據,僅通過「學會如何選擇思考語言」,就能顯著釋放大模型的跨語言潛能。

      這項工作不僅為提升低資源語言的 AI 性能提供了低成本的高效方案,也為理解大模型的跨語言對齊機制提供了新的視角。隨著 AI 全球化的推進,AdaMCoT 有望成為打破語言隔閡、實現「AI 普惠」的關鍵技術之一。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      《江南春》交易后續:關鍵人物浮出水面,12年前曾遭舉報

      《江南春》交易后續:關鍵人物浮出水面,12年前曾遭舉報

      老澽爆笑大聰明
      2025-12-20 22:31:06
      打麻將十打九勝的秘訣,掌握這些小技巧,贏牌簡直是易如反掌!

      打麻將十打九勝的秘訣,掌握這些小技巧,贏牌簡直是易如反掌!

      洞鑒歷史
      2024-03-08 15:03:16
      知名黃金企業突然暴雷,人去樓空,有人抵押幾套房投入700多萬元

      知名黃金企業突然暴雷,人去樓空,有人抵押幾套房投入700多萬元

      第一財經資訊
      2025-12-20 18:25:53
      正是他們的主張!造成龐大貧富差距,令國企員工處境艱難?

      正是他們的主張!造成龐大貧富差距,令國企員工處境艱難?

      特特農村生活
      2025-12-21 00:05:12
      阿隆索后怕!皇馬24歲巨星助攻+造點,3場首發造4球,還好他沒走

      阿隆索后怕!皇馬24歲巨星助攻+造點,3場首發造4球,還好他沒走

      體育知多少
      2025-12-21 08:54:12
      水均益到泉州女婿家做客,和前妻同框還抱外孫女,對女婿稱呼疏離

      水均益到泉州女婿家做客,和前妻同框還抱外孫女,對女婿稱呼疏離

      李佳康
      2025-12-18 01:35:59
      南京的《江南春》與青州的《狀元卷》

      南京的《江南春》與青州的《狀元卷》

      跟著老李看世界
      2025-12-20 09:47:38
      被蘋果“踹開”損失1200億,山東前首富兩年翻盤,凈利潤暴漲200%

      被蘋果“踹開”損失1200億,山東前首富兩年翻盤,凈利潤暴漲200%

      青眼財經
      2025-12-09 18:53:11
      史上最牛妖股!149個漲停板,暴漲55000%......

      史上最牛妖股!149個漲停板,暴漲55000%......

      中國基金報
      2025-12-21 00:11:53
      柴智屏評價F4變F3:朱孝天性格20年沒變!青禾扮演者被拉黑很無奈

      柴智屏評價F4變F3:朱孝天性格20年沒變!青禾扮演者被拉黑很無奈

      一盅情懷
      2025-12-20 17:52:25
      美俄曾聯手阻撓,如今圖160重啟生產線,俄對華求購態度仍然未變

      美俄曾聯手阻撓,如今圖160重啟生產線,俄對華求購態度仍然未變

      坐景觀天
      2025-12-19 07:10:37
      上海警方通報:任某被刑拘!監控曝光:多次在小區做這事,太惡劣

      上海警方通報:任某被刑拘!監控曝光:多次在小區做這事,太惡劣

      極目新聞
      2025-12-21 08:03:38
      C羅豪擲2900萬美元打造葡萄牙最貴別墅,退役后享奢華生活

      C羅豪擲2900萬美元打造葡萄牙最貴別墅,退役后享奢華生活

      星耀國際足壇
      2025-12-20 23:53:29
      炸裂!跨境巨頭突然倒下,老板卷走2.3億跑路:上萬賣家被坑慘了

      炸裂!跨境巨頭突然倒下,老板卷走2.3億跑路:上萬賣家被坑慘了

      青眼財經
      2025-12-20 22:17:43
      掃地出門,倆兒子被婆家“控制”?張嘉倪官宣喜訊,徹底打臉買超

      掃地出門,倆兒子被婆家“控制”?張嘉倪官宣喜訊,徹底打臉買超

      距離距離
      2025-12-19 19:38:42
      轉行當吉他手?科納特被羅梅羅蹬到后,做出吉他里的掃弦動作

      轉行當吉他手?科納特被羅梅羅蹬到后,做出吉他里的掃弦動作

      懂球帝
      2025-12-21 09:25:09
      1-4,英超前冠軍慘敗而歸,不敵聯賽第9,無緣2連勝+跌至第13

      1-4,英超前冠軍慘敗而歸,不敵聯賽第9,無緣2連勝+跌至第13

      凌空倒鉤
      2025-12-21 01:20:33
      中國男人,正在美國化

      中國男人,正在美國化

      茶狐看世界本尊
      2025-12-19 23:45:04
      沖上熱搜!120多萬卡宴只賣60萬,40克金飾能省1萬多元!網友:已經在看機票了

      沖上熱搜!120多萬卡宴只賣60萬,40克金飾能省1萬多元!網友:已經在看機票了

      大風新聞
      2025-12-20 20:56:07
      泰國播放鬼叫嚇唬柬埔寨,收效明顯:東南亞,為何篤信怪力亂神?

      泰國播放鬼叫嚇唬柬埔寨,收效明顯:東南亞,為何篤信怪力亂神?

      黃娜老師
      2025-12-21 01:55:08
      2025-12-21 09:47:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11957文章數 142515關注度
      往期回顧 全部

      教育要聞

      教育家精神萬里行|李杰:微光引路 教育燎原

      頭條要聞

      媒體:歐洲還是不敢動俄羅斯 哪怕普京正在戀愛中

      頭條要聞

      媒體:歐洲還是不敢動俄羅斯 哪怕普京正在戀愛中

      體育要聞

      我開了20年大巴,現在是一名西甲主帥

      娛樂要聞

      2026央視跨年晚會陣容曝光,豪華陣仗

      財經要聞

      百年老店陷貼牌爭議 同仁堂必須作出取舍

      科技要聞

      生態適配已超95% 鴻蒙下一關:十萬個應用

      汽車要聞

      嵐圖推進L3量產測試 已完成11萬公里實際道路驗證

      態度原創

      旅游
      數碼
      游戲
      家居
      藝術

      旅游要聞

      光陰的故事丨在瑞士偶遇峨眉山石?“遠行的石頭”鋪就中瑞友好之路

      數碼要聞

      東芝冰箱再獲紅頂大獎!東芝大白梨以“最全能”實力重塑高端冰箱價值標桿

      獵魂世界:庚辛城全寶箱+回憶+仙草+打卡點一圖流匯總攻略!

      家居要聞

      高端私宅 理想隱居圣地

      藝術要聞

      毛主席致傅作義的信件曝光,字跡生動令人震撼!

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 人妻aⅴ久久久北条麻妃| 亚洲区视频| 午夜精品久久久久久中宇| 潮喷无码正在播放| 狠狠干性| 亚洲成A| 午夜精品视频在线看| 成年入口无限观看免费完整大片| 夜干夜| 日韩大香蕉| 在线天堂中文新版www| 无码粉嫩虎白一线天在线观看| 国产人妻精品一区二区三区| 色午夜| 亚洲成人自拍| 久久久久国产一级毛片高清版A| 日本真人做爰免费的视频| 人人干人人噪人人摸| 亚洲毛多水多男女| 9一传媒| 鹤岗到萝北公交车29路时刻表| 久久永久视频| 天堂中文8资源在线8| 狠狠躁天天躁中文字幕| 国产综合视频一区二区三区| 国产白浆一区二区三区| 国精产品一区一区三区有限公司杨| 思思99热精品在线| 日本亚洲一区二区精品| 国产精品区免费视频| 中文在线最新版天堂| 国产A片网| 国产精品香蕉| 精品在免费线中文字幕久久| 欧美精品一区二区三区在线观看| 国产精品无码翘臀在线观看| 国产猛烈高潮尖叫视频免费| 高安市| 狠狠色AV一区二区| 欧美亚洲h在线一区二区| 亚洲欧洲AV|