![]()
「數(shù)據(jù)-技術(shù)-產(chǎn)品閉環(huán)」
最近讓我印象深刻的產(chǎn)品,是夸克的健康大模型。
垂直大模型的故事大伙聽太多了,無非是基模+知識庫。如何更進(jìn)一步,讓大模型學(xué)習(xí)專業(yè)人士的思考方式,更準(zhǔn)確地生成內(nèi)容?
夸克的解決方案,給了我非常多啟發(fā)。
夸克是直接讓大模型產(chǎn)生符合醫(yī)生思考方式的思維鏈。
他們在后訓(xùn)練階段,使用了大量包含醫(yī)生完整思考過程的數(shù)據(jù),讓模型的思維鏈自然符合醫(yī)生的思考方式。
也就是夸克健康模型的「慢思考」。讓AI一步步分析、初步診斷、鑒別診斷,綜合得出結(jié)論,而不是看到某個(gè)癥狀關(guān)鍵詞,直接擬合出相關(guān)性最大的疾病病因。
體現(xiàn)在考試結(jié)果上,本月,夸克健康模型通過了12門核心學(xué)科的主任醫(yī)師筆試評測。在單純的診斷任務(wù)上,夸克已經(jīng)不遜色于主任醫(yī)師水平。
夸克的技術(shù)思路是,訓(xùn)練AI像醫(yī)生一樣思考,而不僅僅是知道醫(yī)學(xué)知識。
實(shí)現(xiàn)這個(gè)思路,最底層,靠的是定制的醫(yī)學(xué)數(shù)據(jù)
具體來說,夸克定制了上千條包含醫(yī)生思考過程的冷啟動(dòng)數(shù)據(jù)。一份數(shù)據(jù)樣本里,不僅有病人癥狀和診斷結(jié)果,更重要的是,它詳細(xì)記錄了醫(yī)生是如何一步步分析、排除,最終得出結(jié)論的過程。
夸克喂給大模型的數(shù)據(jù),相當(dāng)于是醫(yī)生的「思維鏈」。
所以,當(dāng)夸克在后訓(xùn)練階段,把這些數(shù)據(jù)喂給大模型時(shí),模型學(xué)習(xí)的重點(diǎn)就變了。
大模型學(xué)的是不再是知識點(diǎn),而是一個(gè)真正的醫(yī)生在面對復(fù)雜病例時(shí),從分析病史、到初步診斷、再到鑒別診斷的完整思考路徑。
夸克健康模型目前版本調(diào)用的是通義千問2.5。千問2.5本身不是慢思考專屬的推理模型。但是,用醫(yī)生思考的數(shù)據(jù)訓(xùn)練產(chǎn)生思維鏈,形成夸克健康模型的「慢思考」推理能力。這種做垂直大模型的思路,確實(shí)讓我印象深刻。
在用戶真正提問時(shí)-模型推理過程,夸克也復(fù)現(xiàn)了醫(yī)生思維。
夸克建立了一套「循證醫(yī)學(xué)」知識庫,把海量的醫(yī)學(xué)書籍、論文、診療指南,按照證據(jù)的可靠性分成了ABCD 4個(gè)大等級。
這個(gè)過程,夸克叫做「邊想邊搜」。模型會(huì)根據(jù)自己思考的需要,去查找對應(yīng)證據(jù)等級的文獻(xiàn)來支撐自己的判斷。
所以,用戶看到的每一個(gè)回答,背后都有權(quán)威的原文出處。這最大限度地降低了大模型的幻覺,讓結(jié)果變得可信、可追溯。
![]()
我聽完夸克健康算法和運(yùn)營負(fù)責(zé)人的分享后,忍不住想夸克健康業(yè)務(wù)的核心能力到底是什么?
我覺得一個(gè)是數(shù)據(jù)能力。夸克自建了龐大的數(shù)據(jù)產(chǎn)線。一個(gè)內(nèi)部的專業(yè)醫(yī)生團(tuán)隊(duì)做指揮,牽引著400多位三甲醫(yī)院副主任醫(yī)師以上專家審核。生產(chǎn)了結(jié)構(gòu)化真實(shí)病例數(shù)據(jù),以及包含醫(yī)生思考過程的復(fù)雜任務(wù)數(shù)據(jù)。
夸克醫(yī)療知識庫里,涵蓋了6萬冊教材指南、數(shù)千萬中英文文獻(xiàn)、20余萬藥品說明書等數(shù)據(jù)。
這種投入和高度協(xié)同的工程體系,確實(shí)是大廠才能做到,別人難以復(fù)制的護(hù)城河。
夸克最核心的能力,我覺得是產(chǎn)品能力。
夸克的產(chǎn)品架構(gòu),其實(shí)很像現(xiàn)在流行的Agent產(chǎn)品——一個(gè)主Agent負(fù)責(zé)調(diào)度和通用任務(wù),下面有若干垂直領(lǐng)域的子Agent,處理具體任務(wù)。
夸克健康模型是一個(gè)服務(wù)夸克「超級框」的「子Agent」。
雖然夸克自己沒有這么叫,但這個(gè)垂直模型做了SFT,做了強(qiáng)化學(xué)習(xí),還擅長工具調(diào)用,顯然比市面上絕大部分Agent產(chǎn)品更符合Agent定義。
搜索框是一個(gè)「主Agent」,是所有任務(wù)的總?cè)肟凇.?dāng)它判斷用戶的問題屬于醫(yī)療健康這個(gè)垂直領(lǐng)域時(shí),就會(huì)調(diào)用健康模型這個(gè)「子Agent」來處理。
這個(gè)「子Agent」本身具備完整的思維鏈和工具調(diào)用能力,它能獨(dú)立完成復(fù)雜的推理任務(wù),然后把準(zhǔn)確的結(jié)果返回給用戶。
一個(gè)非常優(yōu)雅的技術(shù)與產(chǎn)品閉環(huán)。
![]()
夸克給出的數(shù)據(jù)是,每月有2000萬用戶在夸克上搜索健康問題,全國一半的醫(yī)學(xué)生都用夸克查資料、備考。
夸克健康模型避開了上一代互聯(lián)網(wǎng)醫(yī)療「重運(yùn)營、難盈利」的困境,不碰診療業(yè)務(wù),只提供更專業(yè)、準(zhǔn)確的搜索信息。
整個(gè)研究下來,最讓我印象深刻的,是夸克健康模型把數(shù)據(jù)、技術(shù)、產(chǎn)品這三個(gè)環(huán)節(jié),銜接得極其絲滑。
你把任何一個(gè)點(diǎn)單拎出來看,都不算驚艷。基于開源模型做后訓(xùn)練,很多人能做;RAG調(diào)用知識庫,也不新鮮。
但是,能把這些環(huán)節(jié)組合在一起,形成一個(gè)高度閉環(huán)的產(chǎn)品體驗(yàn),這才是夸克的核心能力。
沒有廣告,短期內(nèi)不用考慮商業(yè)化問題,不會(huì)因?yàn)樯虡I(yè)化而動(dòng)作變形。這確實(shí)是一個(gè)億級月活A(yù)PP難得的定力,可以專注做好產(chǎn)品。
本質(zhì)上,夸克健康模型是一個(gè)用新技術(shù)(大模型/思維鏈)和笨功夫(高質(zhì)量數(shù)據(jù)),去重新解決一個(gè)舊問題的故事。
這個(gè)舊問題,就是醫(yī)療信息的不對稱和搜索結(jié)果的混亂。
現(xiàn)在,AI時(shí)代,夸克用「數(shù)據(jù)-技術(shù)-產(chǎn)品」一體的產(chǎn)品理念,把這個(gè)故事重講了一遍。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.