衡宇 發自 凹非寺
量子位 | 公眾號 QbitAI
“我們沒有能力一會兒金融、一會兒娛樂、一會兒醫療,只能深耕一條主線。”
百川智能CEO王小川用這樣一句話,給過去兩年被外界不斷拉扯的路線畫下一條清晰的邊界。
與此同時,百川發布并開源新一代醫療大模型Baichuan-M3。
在OpenAI推出的醫療AI評測HealthBench上,Baichuan-M3以65.1分位列第一;在不依賴工具或檢索增強的純模型設置下,其醫療幻覺率降至3.5,達到當前世界最低。
王小川表明公司賬上有約30億元資金,意味著百川可以在一條賽道里持續投入。
他說,百川智能成立那天起,他就已經在全員信中寫道:
- 立志往后二十年,為生命科學和醫學的發展盡一份力,為大眾健康做出一點貢獻,核心路徑是構建生命健康數學模型,并已經付諸行動。
談及近期備受關注的AI大模型企業上市,王小川表示“他們主要還是踩在通用模型技術紅利和政策支持的基礎上”,醫療AI成熟會晚一點,還有一、兩年的時間。
“百川預計在2027年啟動IPO上市。”
![]()
百川智能模型技術負責人鞠強透露,百川目前約80%的算力都投入到強化學習相關訓練,M3正是在這一訓練策略下成型的階段性成果。
除了強推理和低幻覺,端到端的問診能力是M3另一項突出能力。
模型之外,百川也同步給出了產品側的時間表——
今年上半年,百川將陸續發布兩款to C的醫療產品。初期免費開放,后續可按模塊引入付費能力,重點服務于患者的輔助決策與居家健康看護場景。
“和最近市面上大家看到很多的泛健康醫療AI產品不一樣。”王小川說。
80%的算力投入強化學習,有了M3模型
和去年5月發布的Baichuan-M2相比,Baichuan-M3在模型的訓練重心發生了根本變化。
其核心關鍵詞可以用一句話概括:fact-aware的強化學習。
鞠強表示,醫療大模型普遍面臨一個難以回避的問題:推理能力越強的模型,越容易在醫療場景中產生幻覺;而一味壓制幻覺,又會讓模型在復雜問題面前變得過于保守。
Baichuan-M2時期,百川更多依賴工具鏈和后處理方式來兜底,Baichuan-M3則選擇了把幻覺問題前移到訓練階段解決。
鞠強進一步解釋:
- M3的訓練并不是簡單提高強化學習的比例,而是重新定義了“什么是錯誤”。
當模型給出看似合理、但缺乏事實依據的醫療判斷時,這類輸出會在訓練中被明確懲罰;與此同時,模型在推理鏈條中的探索空間并沒有被壓縮。
這種對事實一致性的感知能力,是fact-aware強化學習的關鍵所在。
![]()
圍繞這一目標,Baichuan-M3在訓練和算法層面做了幾處關鍵調整。
第一項變化發生在強化學習的動態性上。
Baichuan-M2階段,患者狀態是動態的,但負責打分的“醫生評價模型”相對固定;到了Baichuan-M3這里,評價模型本身也會隨主模型能力提升而迭代,避免模型在后期訓練中提前撞上能力天花板。
第二項升級體現在幻覺控制方式的轉變。
Baichuan-M3不再依賴外部循證工具去修正輸出,而是在模型內部完成幻覺壓制,這使得問診過程可以保持連續性,而不會頻繁被工具調用打斷。
第三項變化針對的是醫療場景特有的長對話結構。
鞠強提到,現有通用強化學習算法在多輪問診中容易不穩定,百川為此專門對算法結構做了改造,使模型能夠在較長對話中保持目標一致性。
以上技術調整讓Baichuan-M3具備了“原生的、端到端的嚴肅問診能力”。王小川強調,這和通過prompt讓大模型扮演醫生完全不一樣。
![]()
明確“嚴肅醫療”,重視“院外需求”
聊完技術后,王小川花了相當多時間講“為什么醫療必須重做一遍”。
在他看來,當下國內醫療方面有四個長期的結構性不足。
首先是醫生數量始終無法匹配需求;其次,醫患關系高度不對等,患者是信息最少的一方,卻要承擔決策后果;第三,國內沒有家庭醫生體系,大量病人被動涌向三甲醫院;最后,醫學本身仍然存在認知盲區,醫生也有不確定和不了解的情況。
基于此,百川想讓普通人都明明白白地看病。
- 知道自己在經歷什么、為什么要這樣做、下一步有哪些選擇。
你能理解醫生在判斷什么,你能把這些話復述給另一個醫生聽,你也知道如果選擇A或B,大概會發生什么。
因此,百川選擇把更多精力放在院外診療場景,尤其是患者在家中面對不確定癥狀時的輔助決策能力。
在王小川的敘述里,百川這么做的重要原因是團隊相信:未來真正的醫療增量本來就不在醫院里。
在王小川看來,醫院更多承擔的是執行功能。
“你已經決定要做什么了,來醫院,是做檢查、做手術、用藥、監護。真正影響患者路徑的判斷往往發生在更早的時候。癥狀出現時要不要重視?先去哪里?是否需要再確認一次?這些決定,很多時候是在醫生不在場的情況下完成的。”
這一選擇也直接決定了其商業化方向——是“嚴肅醫療”,是“院外需求”。
雖然產品還未亮相,但根據其回應,所推出的產品不會越過監管邊界給出診斷或處方,主要功能還是幫助用戶理解信息、整理癥狀,并明確下一步行動。
王小川表示,在能力層面,Baichuan-M3已經足夠發揮這樣的作用,但不意味著百川會急于把模型推向所有場景。
One More Thing
百川的醫療AI產品理念上覆蓋全病種,但也給了明確重點:
第一步,兒科和腫瘤。
目前,已與北京兒童醫院和中國醫學科學院腫瘤醫院合作,推進真實場景驗證。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.