網易首頁 > 網易號 > 正文申請入駐

首創“證據錨定”，百川推出最低幻覺循證增強醫療大模型M3 Plus

2026-01-22 16:20:27　來源: 藍媒匯

天津舉報

分享至

1月22日，百川智能正式發布 Baichuan-M3 Plus，嚴肅醫療場景下的問答準確性、可靠性，再次刷新了剛剛推出的M3所創下的世界紀錄。憑借獨創的六源循證技術與M3基座結合，M3 Plus將幻覺率降低至2.6%，低于 Open Evidence，達到全球最低水平；首創“證據錨定”技術，不僅給出引文來源，還能將模型生成的每一句醫學結論，精確錨定到原始論文中的對應證據段落，使 AI 的醫學判斷真正做到可核驗、可追責、可教學。

更具意義的是，百川宣布推出「海納百川」計劃，將全球最低幻覺的循證增強醫療大模型以API形式，免費開放給中國醫療服務機構，共同繁榮國內的AI醫療生態，推動中國AI醫療的變革，讓每一位中國醫務工作者都能擁有可靠、好用的AI助手。

低幻覺率再次刷新世界紀錄，讓AI具備邁向臨床的診療能力

對于中國的醫生而言，擁抱AI的先決條件，是AI真實具備了足夠優秀的診療能力。當患者頻繁使用DeepSeek、豆包等通用大模型的AI產品去尋求診療建議，大量的誤判、幻覺，不僅讓醫生不勝其煩，更逐漸演變為一場對中國醫療AI技術的信任危機。

隨著上周百川M3大模型的正式開源，這一局面已被徹底打破。M3不僅在 Healthbench、Healthbench Hard 等多個權威評測中登頂榜首，實現了對 GPT-5.2的全面超越，更在 OpenAI 引以為傲的低幻覺領域完成超越，以3.5%的幻覺率領跑全球。

作為百川拓展低幻覺技術路線的成功實踐，M3首創的 Fact-Aware RL的強化學習范式，使底座模型在無工具的設定下，幻覺也能大幅降低到SOTA水平。在此基礎上，M3 Plus 將 M2 Plus 模型已驗證有效的六源循證范式，引入模型訓練和推理過程，確保模型的每條建議都有專業醫學證據支持。最終，M3 Plus的事實性幻覺降低到新的SOTA，僅2.6%，相較GPT-5.2大幅下降超30%。即便與行業標桿 Open Evidence相比，M3 Plus 也完成了超越。

首創“證據錨定”技術：讓 AI 的每一句醫學結論，都能被逐句核驗

在循證醫學體系中，真正決定醫生是否信任一條結論的，從來不是語言是否流暢，而是結論背后的證據是否權威、是否準確、是否可追溯。相比“說得像不像醫生”，臨床更關心的是：這句話，究竟依據哪篇論文、哪條指南、哪一段原文。

當前行業中，無論是通用大模型還是醫療模型，大多已支持“文獻引用”——在結論后標注論文或指南來源。但在實際使用中，醫生往往會發現：點開引文，依然無法判斷 AI 的這句結論究竟源自哪一段證據。更常見的問題是兩類：一是“張冠李戴”，引用編號存在，但文獻內容對不上；二是“內容沖突”，文獻本身正確，但被引用的段落與結論并不匹配，甚至存在拼接、誤讀。

百川 M3 Plus 首創“證據錨定（Evidence Anchoring）”技術，不是簡單標注“引用自哪篇文獻”，而是要求模型生成的每一句醫學結論，都必須精確對應到原始論文或指南中的具體證據段落。每一句判斷，都能被逐字溯源、逐條核驗。

為實現這一目標，百川將“證據錨定”作為獨立訓練目標，引入 Citation Reward Model，對錯誤引用進行明確懲罰，讓模型只能在“確實有證據支持”的空間中推理與生成。最終，結論與證據段落的匹配準確率超過 95%，真正讓 AI 的醫學判斷做到可核驗、可追責、可教學。

M3 Plus API 調用價格較上一代模型大幅降低70%

在大模型快速演進的當下，能力越強的模型，調用成本往往越高，許多優秀的應用因此難以規模化落地，更難真正走進臨床一線。百川認為，只有持續降低智力成本，AI 才能覆蓋臨床、教學等真實場景，成為醫生和患者“用得起、用得好”的基礎能力。

為此，M3 Plus 在系統層面進行了全面的工程重構，通過 MoE 架構優化、模型量化以及 Gated Eagle-3 投機解碼等關鍵技術，在嚴格保證模型能力與可靠性的前提下，實現了 API 調用成本較上一代降低 70%，為 AI 在醫療場景的規模化應用掃清了關鍵障礙。

百川全面開放M3 Plus的技術能力，API限時免費體驗15天，所有開發者均可申請使用。

「海納百川」計劃開啟，M3 Plus 向行業伙伴免費開放

隨著人工智能開始進入門診、病房和醫學教學等真實場景，越來越多醫生在工作中接觸到 AI：查資料、看指南、對照證據、推敲診療方案。但在高強度、強責任的臨床環境中，AI 能在多大程度上真正幫到醫生，仍需要在真實使用中不斷探索。

醫生“用好 AI”的新局面，要靠足夠多的行業伙伴在真實場景里一起打磨——怎么嵌入醫療流程、怎么做證據呈現、怎么做風險提示、怎么支持年輕醫生成長。

為此，百川發起「海納百川」計劃：面向所有服務醫務工作者的機構，免費提供全球幻覺最低循證增強醫療大模型 M3 Plus 的 API，把服務醫生的AI能力直接交到生態伙伴手里。

從核心技術的持續突破，到面向行業生態的免費開放，「海納百川」不僅是一個名字，更是一份推動中國AI+醫療發展的承諾。百川愿與行業伙伴一道，圍繞醫生、面向患者，推動醫療 AI 更安全、更可及、更有溫度地發展，讓技術進步真正轉化為人民健康的長期福祉。

「海納百川」計劃｜參與條件：

適用對象：

為醫務工作者提供服務的機構

醫務工作者包括醫生、藥劑師、醫技師、護士、健管師、醫學生等

適用場景僅限于：

臨床輔助決策、醫學教育

用途限制：

僅用于真實服務場景、不得用于數據生產

使用要求：

產品需明確展示 Powered by 百川、不得對模型輸出進行影響準確性的修改

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.