![]()
1月22日,百川智能正式發布 Baichuan-M3 Plus,嚴肅醫療場景下的問答準確性、可靠性,再次刷新了剛剛推出的M3所創下的世界紀錄。憑借獨創的六源循證技術與M3基座結合,M3 Plus將幻覺率降低至2.6%,低于 Open Evidence,達到全球最低水平;首創“證據錨定”技術,不僅給出引文來源,還能將模型生成的每一句醫學結論,精確錨定到原始論文中的對應證據段落,使 AI 的醫學判斷真正做到可核驗、可追責、可教學。
更具意義的是,百川宣布推出「海納百川」計劃,將全球最低幻覺的循證增強醫療大模型以API形式,免費開放給中國醫療服務機構,共同繁榮國內的AI醫療生態,推動中國AI醫療的變革,讓每一位中國醫務工作者都能擁有可靠、好用的AI助手。
低幻覺率再次刷新世界紀錄,讓AI具備邁向臨床的診療能力
對于中國的醫生而言,擁抱AI的先決條件,是AI真實具備了足夠優秀的診療能力。當患者頻繁使用DeepSeek、豆包等通用大模型的AI產品去尋求診療建議,大量的誤判、幻覺,不僅讓醫生不勝其煩,更逐漸演變為一場對中國醫療AI技術的信任危機。
隨著上周百川M3大模型的正式開源,這一局面已被徹底打破。M3不僅在 Healthbench、Healthbench Hard 等多個權威評測中登頂榜首,實現了對 GPT-5.2的全面超越,更在 OpenAI 引以為傲的低幻覺領域完成超越,以3.5%的幻覺率領跑全球。
作為百川拓展低幻覺技術路線的成功實踐,M3首創的 Fact-Aware RL的強化學習范式,使底座模型在無工具的設定下,幻覺也能大幅降低到SOTA水平。在此基礎上,M3 Plus 將 M2 Plus 模型已驗證有效的六源循證范式,引入模型訓練和推理過程,確保模型的每條建議都有專業醫學證據支持。最終,M3 Plus的事實性幻覺降低到新的SOTA,僅2.6%,相較GPT-5.2大幅下降超30%。即便與行業標桿 Open Evidence相比,M3 Plus 也完成了超越。
![]()
首創“證據錨定”技術:讓 AI 的每一句醫學結論,都能被逐句核驗
在循證醫學體系中,真正決定醫生是否信任一條結論的,從來不是語言是否流暢,而是結論背后的證據是否權威、是否準確、是否可追溯。相比“說得像不像醫生”,臨床更關心的是:這句話,究竟依據哪篇論文、哪條指南、哪一段原文。
當前行業中,無論是通用大模型還是醫療模型,大多已支持“文獻引用”——在結論后標注論文或指南來源。但在實際使用中,醫生往往會發現:點開引文,依然無法判斷 AI 的這句結論究竟源自哪一段證據。更常見的問題是兩類:一是“張冠李戴”,引用編號存在,但文獻內容對不上;二是“內容沖突”,文獻本身正確,但被引用的段落與結論并不匹配,甚至存在拼接、誤讀。
百川 M3 Plus 首創“證據錨定(Evidence Anchoring)”技術,不是簡單標注“引用自哪篇文獻”,而是要求模型生成的每一句醫學結論,都必須精確對應到原始論文或指南中的具體證據段落。每一句判斷,都能被逐字溯源、逐條核驗。
為實現這一目標,百川將“證據錨定”作為獨立訓練目標,引入 Citation Reward Model,對錯誤引用進行明確懲罰,讓模型只能在“確實有證據支持”的空間中推理與生成。最終,結論與證據段落的匹配準確率超過 95%,真正讓 AI 的醫學判斷做到可核驗、可追責、可教學。
![]()
M3 Plus API 調用價格較上一代模型大幅降低70%
在大模型快速演進的當下,能力越強的模型,調用成本往往越高,許多優秀的應用因此難以規模化落地,更難真正走進臨床一線。百川認為,只有持續降低智力成本,AI 才能覆蓋臨床、教學等真實場景,成為醫生和患者“用得起、用得好”的基礎能力。
為此,M3 Plus 在系統層面進行了全面的工程重構,通過 MoE 架構優化、模型量化以及 Gated Eagle-3 投機解碼等關鍵技術,在嚴格保證模型能力與可靠性的前提下,實現了 API 調用成本較上一代降低 70%,為 AI 在醫療場景的規模化應用掃清了關鍵障礙。
百川全面開放M3 Plus的技術能力,API限時免費體驗15天,所有開發者均可申請使用。
「海納百川」計劃開啟,M3 Plus 向行業伙伴免費開放
隨著人工智能開始進入門診、病房和醫學教學等真實場景,越來越多醫生在工作中接觸到 AI:查資料、看指南、對照證據、推敲診療方案。但在高強度、強責任的臨床環境中,AI 能在多大程度上真正幫到醫生,仍需要在真實使用中不斷探索。
醫生“用好 AI”的新局面,要靠足夠多的行業伙伴在真實場景里一起打磨——怎么嵌入醫療流程、怎么做證據呈現、怎么做風險提示、怎么支持年輕醫生成長。
為此,百川發起 「海納百川」計劃:面向所有服務醫務工作者的機構,免費提供全球幻覺最低循證增強醫療大模型 M3 Plus 的 API,把服務醫生的AI能力直接交到生態伙伴手里。
從核心技術的持續突破,到面向行業生態的免費開放,「海納百川」不僅是一個名字,更是一份推動中國AI+醫療發展的承諾。百川愿與行業伙伴一道,圍繞醫生、面向患者,推動醫療 AI 更安全、更可及、更有溫度地發展,讓技術進步真正轉化為人民健康的長期福祉。
「海納百川」計劃|參與條件:
適用對象:
為醫務工作者提供服務的機構
醫務工作者包括醫生、藥劑師、醫技師、護士、健管師、醫學生等
適用場景僅限于:
臨床輔助決策、醫學教育
用途限制:
僅用于真實服務場景、不得用于數據生產
使用要求:
產品需明確展示 Powered by 百川、不得對模型輸出進行影響準確性的修改
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.