網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

AI用一晚睡眠數(shù)據(jù)預(yù)測多種疾病風(fēng)險(xiǎn)，準(zhǔn)確率最高85%

2026-04-07 19:08:11　來源: DeepTech深科技

北京舉報(bào)

分享至

本文是專業(yè)學(xué)術(shù)論文解讀，不做醫(yī)療建議。

近日，美國斯坦福大學(xué)James Zou教授團(tuán)隊(duì)和 Emmanuel Mignot 教授團(tuán)隊(duì)所打造的 SleepFM AI 模型只需用戶一個(gè)晚上的睡眠監(jiān)測數(shù)據(jù)，就能預(yù)測多種疾病風(fēng)險(xiǎn)。

Emmanuel Mignot 教授是睡眠醫(yī)學(xué)領(lǐng)域的世界級(jí)專家，James Zou 在 AI 和生命科學(xué)領(lǐng)域深耕已久。

（來源：資料圖）

他們所打造的這款模型基于大約 6.5 萬人、58.5 萬小時(shí)的睡眠記錄訓(xùn)練而來，可以評(píng)估全因死亡、癡呆、心梗以及包含部分癌癥在內(nèi)的大約 130 種疾病，預(yù)測性能C 指數(shù)多數(shù)在 75% 以上，是睡眠醫(yī)學(xué)與 AI 結(jié)合的重要突破。（注：C 指數(shù)（C Index）是衡量模型能在多大程度上準(zhǔn)確判斷誰比誰更早生病或死亡的指標(biāo)。）

舉幾個(gè)數(shù)字：預(yù)測全新死亡率，準(zhǔn)確率達(dá)到 84%；預(yù)測癡呆癥，準(zhǔn)確率達(dá)到 85%；預(yù)測心肌梗死，準(zhǔn)確率達(dá)到 81%。這些數(shù)字在醫(yī)學(xué)預(yù)測領(lǐng)域?qū)儆谙喈?dāng)高的水準(zhǔn)。

如前所述，SleepFM 接受了超過 58.5 萬小時(shí)睡眠數(shù)據(jù)的訓(xùn)練，涵蓋了 6.5 萬名不同年齡、不同健康狀況的參與者，等于它見過各種各樣的人的睡眠質(zhì)量，也等于知道了這些人后來都生了什么病。

簡單的一個(gè)睡覺為何可以看出這么東西？睡眠不是簡單的休息，是一個(gè)極其復(fù)雜的生理過程。你的大腦、心臟、呼吸系統(tǒng)、肌肉，在睡眠中會(huì)展現(xiàn)出豐富的活動(dòng)模式。這些模式就像指紋一樣，藏著大量關(guān)于健康狀況的信息。

（來源：https://www.nature.com/articles/s41591-025-04133-4）

SleepFM 同時(shí)分析了四個(gè)維度的信號(hào)：腦電波（EEG）、心電圖（ECG）、肌電圖（EMG）和呼吸信號(hào)。它不僅看某一個(gè)單一的指標(biāo)，也把所有這些信號(hào)融合在一起，從整體上去理解一個(gè)人的睡眠狀態(tài)。

此前醫(yī)療機(jī)構(gòu)已有不少睡眠監(jiān)測設(shè)備，但是有的通道多，有的通道少，有的測這個(gè)，有的不測那個(gè)。SleepFM 則采用了一種通道無關(guān)的設(shè)計(jì)，不管你有幾個(gè)信號(hào)通道、順序如何排列，它都能處理。

在具體任務(wù)上：

SleepFM 能夠把整晚睡眠分為清醒期、淺睡期、深睡期和快速眼動(dòng)期，F(xiàn)1 得分在 70%到 78%之間，和當(dāng)前最專業(yè)的睡眠分期模型 U Sleep 不相上下。（注：F1 得分是衡量模型分類準(zhǔn)確性的綜合指標(biāo)，兼顧了模型判斷得全不全和準(zhǔn)不準(zhǔn)。）

（來源：https://www.nature.com/articles/s41591-025-04133-4）

對(duì)于睡眠呼吸暫停的情況，SleepFM 在判斷有無中度到重度呼吸暫停的準(zhǔn)確率上達(dá)到 87%。

這些能夠固然重要，但讓人眼前更加一亮的是疾病預(yù)測。研究人員把 SleepFM 的預(yù)測結(jié)果和兩種基線模型做了對(duì)比。

第一種基線只用了年齡、性別、體重指數(shù)和種族這些基本信息。第二種基線直接拿原始睡眠信號(hào)去訓(xùn)練，完全沒有經(jīng)過預(yù)訓(xùn)練。結(jié)果 SleepFM 在所有疾病類別上都勝出了，AUROC 平均高出 5% 到 17%。（注：AUROC 衡量的是模型區(qū)分正負(fù)樣本比如生病和不生病的能力，數(shù)值越高說明模型越能夠正確地將兩類人分開。）

在預(yù)測老年癡呆癥上，SleepFM 的 C Index 達(dá)到 99%，而只用人口學(xué)信息的模型只有 87%。預(yù)測帕金森病，SleepFM 是 93%，基線模型是 79%。預(yù)測糖尿病伴隨循環(huán)系統(tǒng)并發(fā)癥，SleepFM 是 89%，基線模型是 79%。

（來源：https://www.nature.com/articles/s41591-025-04133-4）

即使不看年齡和性別，只憑 SleepFM 從睡眠信號(hào)里學(xué)到的特征，它的預(yù)測效果依然優(yōu)于只靠人口學(xué)信息的模型，這說明睡眠信號(hào)本身蘊(yùn)含的信息量遠(yuǎn)超人類的想象。

SleepFM 還有一個(gè)很實(shí)用的特點(diǎn)，那就是遷移學(xué)習(xí)能力強(qiáng)。研究人員在一個(gè)名為 SHHS 的獨(dú)立數(shù)據(jù)集上對(duì)其進(jìn)行測試。這個(gè)數(shù)據(jù)集完全沒有參與過預(yù)訓(xùn)練，這意味著 SleepFM 需要適應(yīng)新的醫(yī)院、新的設(shè)備和新的患者群體。

結(jié)果 SleepFM 依然表現(xiàn)穩(wěn)健，預(yù)測中風(fēng)的 C Index 達(dá)到 81%，預(yù)測充血性心衰達(dá)到 85%，預(yù)測心血管疾病死亡達(dá)到 86%。換句話說，SleepFM 不僅能在自己的舒適區(qū)里工作，換到一個(gè)新地方它也能夠很快上手。

另外，以往類似的睡眠研究，樣本量大多在幾千到一萬多之間。SleepFM 的預(yù)訓(xùn)練數(shù)據(jù)量是前者的 5 到 25 倍。規(guī)模大了，模型能夠?qū)W習(xí)到的東西就更全面，泛化能力也更強(qiáng)。

（來源：https://www.nature.com/articles/s41591-025-04133-4）

當(dāng)然，這項(xiàng)研究也有局限性。比如，數(shù)據(jù)主要來自“因懷疑自己有睡眠問題而去醫(yī)院做檢查”的人群，并不是來自完全健康的普通人。SleepFM 在時(shí)間跨度上的預(yù)測準(zhǔn)確性也會(huì)有所下降，因?yàn)獒t(yī)療實(shí)踐和患者特征也在不斷變化。不過，這些都不影響本次研究的核心結(jié)論，那就是睡眠真的是一個(gè)被嚴(yán)重低估的健康信息寶庫。

未來，這項(xiàng)技術(shù)還有可能走進(jìn)尋常百姓家。事實(shí)上，很多智能手表和智能手環(huán)已經(jīng)能夠檢測心率、呼吸和睡眠分歧。如果能夠?qū)?SleepFM 這樣的模型壓縮到可穿戴設(shè)備上，我們每天醒來就能看到自己的健康風(fēng)險(xiǎn)評(píng)估，也能尋求醫(yī)生幫助來提前介入，更好地防患于未然。

參考資料：

相關(guān)論文 https://www.nature.com/articles/s41591-025-04133-4

代碼：https://github.com/zou-group/sleepfm-clinical

https://med.stanford.edu/news/all-news/2026/01/ai-sleep-disease.html

運(yùn)營/排版：何晨龍

本文是專業(yè)學(xué)術(shù)論文解讀，不做醫(yī)療建議。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.