本文是專業(yè)學(xué)術(shù)論文解讀,不做醫(yī)療建議。
近日,美國斯坦福大學(xué)James Zou教授團(tuán)隊(duì)和 Emmanuel Mignot 教授團(tuán)隊(duì)所打造的 SleepFM AI 模型只需用戶一個(gè)晚上的睡眠監(jiān)測數(shù)據(jù),就能預(yù)測多種疾病風(fēng)險(xiǎn)。
Emmanuel Mignot 教授是睡眠醫(yī)學(xué)領(lǐng)域的世界級(jí)專家,James Zou 在 AI 和生命科學(xué)領(lǐng)域深耕已久。
![]()
(來源:資料圖)
他們所打造的這款模型基于大約 6.5 萬人、58.5 萬小時(shí)的睡眠記錄訓(xùn)練而來,可以評(píng)估全因死亡、癡呆、心梗以及包含部分癌癥在內(nèi)的大約 130 種疾病,預(yù)測性能C 指數(shù)多數(shù)在 75% 以上,是睡眠醫(yī)學(xué)與 AI 結(jié)合的重要突破。(注:C 指數(shù)(C Index)是衡量模型能在多大程度上準(zhǔn)確判斷誰比誰更早生病或死亡的指標(biāo)。)
舉幾個(gè)數(shù)字:預(yù)測全新死亡率,準(zhǔn)確率達(dá)到 84%;預(yù)測癡呆癥,準(zhǔn)確率達(dá)到 85%;預(yù)測心肌梗死,準(zhǔn)確率達(dá)到 81%。這些數(shù)字在醫(yī)學(xué)預(yù)測領(lǐng)域?qū)儆谙喈?dāng)高的水準(zhǔn)。
如前所述,SleepFM 接受了超過 58.5 萬小時(shí)睡眠數(shù)據(jù)的訓(xùn)練,涵蓋了 6.5 萬名不同年齡、不同健康狀況的參與者,等于它見過各種各樣的人的睡眠質(zhì)量,也等于知道了這些人后來都生了什么病。
簡單的一個(gè)睡覺為何可以看出這么東西?睡眠不是簡單的休息,是一個(gè)極其復(fù)雜的生理過程。你的大腦、心臟、呼吸系統(tǒng)、肌肉,在睡眠中會(huì)展現(xiàn)出豐富的活動(dòng)模式。這些模式就像指紋一樣,藏著大量關(guān)于健康狀況的信息。
![]()
(來源:https://www.nature.com/articles/s41591-025-04133-4)
SleepFM 同時(shí)分析了四個(gè)維度的信號(hào):腦電波(EEG)、心電圖(ECG)、肌電圖(EMG)和呼吸信號(hào)。它不僅看某一個(gè)單一的指標(biāo),也把所有這些信號(hào)融合在一起,從整體上去理解一個(gè)人的睡眠狀態(tài)。
此前醫(yī)療機(jī)構(gòu)已有不少睡眠監(jiān)測設(shè)備,但是有的通道多,有的通道少,有的測這個(gè),有的不測那個(gè)。SleepFM 則采用了一種通道無關(guān)的設(shè)計(jì),不管你有幾個(gè)信號(hào)通道、順序如何排列,它都能處理。
在具體任務(wù)上:
SleepFM 能夠把整晚睡眠分為清醒期、淺睡期、深睡期和快速眼動(dòng)期,F(xiàn)1 得分在 70%到 78%之間,和當(dāng)前最專業(yè)的睡眠分期模型 U Sleep 不相上下。(注:F1 得分是衡量模型分類準(zhǔn)確性的綜合指標(biāo),兼顧了模型判斷得全不全和準(zhǔn)不準(zhǔn)。)
![]()
(來源:https://www.nature.com/articles/s41591-025-04133-4)
對(duì)于睡眠呼吸暫停的情況,SleepFM 在判斷有無中度到重度呼吸暫停的準(zhǔn)確率上達(dá)到 87%。
這些能夠固然重要,但讓人眼前更加一亮的是疾病預(yù)測。研究人員把 SleepFM 的預(yù)測結(jié)果和兩種基線模型做了對(duì)比。
第一種基線只用了年齡、性別、體重指數(shù)和種族這些基本信息。第二種基線直接拿原始睡眠信號(hào)去訓(xùn)練,完全沒有經(jīng)過預(yù)訓(xùn)練。結(jié)果 SleepFM 在所有疾病類別上都勝出了,AUROC 平均高出 5% 到 17%。(注:AUROC 衡量的是模型區(qū)分正負(fù)樣本比如生病和不生病的能力,數(shù)值越高說明模型越能夠正確地將兩類人分開。)
在預(yù)測老年癡呆癥上,SleepFM 的 C Index 達(dá)到 99%,而只用人口學(xué)信息的模型只有 87%。預(yù)測帕金森病,SleepFM 是 93%,基線模型是 79%。預(yù)測糖尿病伴隨循環(huán)系統(tǒng)并發(fā)癥,SleepFM 是 89%,基線模型是 79%。
![]()
(來源:https://www.nature.com/articles/s41591-025-04133-4)
即使不看年齡和性別,只憑 SleepFM 從睡眠信號(hào)里學(xué)到的特征,它的預(yù)測效果依然優(yōu)于只靠人口學(xué)信息的模型,這說明睡眠信號(hào)本身蘊(yùn)含的信息量遠(yuǎn)超人類的想象。
SleepFM 還有一個(gè)很實(shí)用的特點(diǎn),那就是遷移學(xué)習(xí)能力強(qiáng)。研究人員在一個(gè)名為 SHHS 的獨(dú)立數(shù)據(jù)集上對(duì)其進(jìn)行測試。這個(gè)數(shù)據(jù)集完全沒有參與過預(yù)訓(xùn)練,這意味著 SleepFM 需要適應(yīng)新的醫(yī)院、新的設(shè)備和新的患者群體。
結(jié)果 SleepFM 依然表現(xiàn)穩(wěn)健,預(yù)測中風(fēng)的 C Index 達(dá)到 81%,預(yù)測充血性心衰達(dá)到 85%,預(yù)測心血管疾病死亡達(dá)到 86%。換句話說,SleepFM 不僅能在自己的舒適區(qū)里工作,換到一個(gè)新地方它也能夠很快上手。
另外,以往類似的睡眠研究,樣本量大多在幾千到一萬多之間。SleepFM 的預(yù)訓(xùn)練數(shù)據(jù)量是前者的 5 到 25 倍。規(guī)模大了,模型能夠?qū)W習(xí)到的東西就更全面,泛化能力也更強(qiáng)。
![]()
(來源:https://www.nature.com/articles/s41591-025-04133-4)
當(dāng)然,這項(xiàng)研究也有局限性。比如,數(shù)據(jù)主要來自“因懷疑自己有睡眠問題而去醫(yī)院做檢查”的人群,并不是來自完全健康的普通人。SleepFM 在時(shí)間跨度上的預(yù)測準(zhǔn)確性也會(huì)有所下降,因?yàn)獒t(yī)療實(shí)踐和患者特征也在不斷變化。不過,這些都不影響本次研究的核心結(jié)論,那就是睡眠真的是一個(gè)被嚴(yán)重低估的健康信息寶庫。
未來,這項(xiàng)技術(shù)還有可能走進(jìn)尋常百姓家。事實(shí)上,很多智能手表和智能手環(huán)已經(jīng)能夠檢測心率、呼吸和睡眠分歧。如果能夠?qū)?SleepFM 這樣的模型壓縮到可穿戴設(shè)備上,我們每天醒來就能看到自己的健康風(fēng)險(xiǎn)評(píng)估,也能尋求醫(yī)生幫助來提前介入,更好地防患于未然。
參考資料:
相關(guān)論文 https://www.nature.com/articles/s41591-025-04133-4
代碼:https://github.com/zou-group/sleepfm-clinical
https://med.stanford.edu/news/all-news/2026/01/ai-sleep-disease.html
運(yùn)營/排版:何晨龍
本文是專業(yè)學(xué)術(shù)論文解讀,不做醫(yī)療建議。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.