癌癥的細胞異質性深刻影響患者預后與治療策略的制定,然而,解析臨床樣本中這種復雜的細胞構成特征,至今仍是腫瘤研究領域的一大挑戰。 單細胞 RNA 測序( scRNA -seq )以前所未有的分辨率揭示了基因表達特征,初步破解該難題,但其高昂成本限制了細胞類型與患者預后關聯的大規模研究。與之相對,癌癥基因組圖譜( TCGA )、基因表達數據庫( GEO )等公共數據庫的批量 RNA 測序( bulk RNA-seq )和基因芯片數據,富含臨床信息,提供了可規模化的替代方案。反卷積算法以 scRNA -seq 為參考,通過估算 bulk 數據中的細胞類型占比,搭建起兩類技術的橋梁,探究細胞類型與疾病的關聯。
然而,反卷積算法的基準測試仍面臨顯著挑戰:目前相關研究均依賴偽批量測序數據或流式細胞術數據,默認細胞類型絕對占比已知,但對于真實 bulk RNA 表達數據, 但對于真實 bulk RNA 表達數據而言,此類精確的先驗信息并不存在;另一方面,由于 生物噪聲與技術噪聲的干擾 ,反卷積算法在偽批量數據上的優異表現,也并不總能代表其在真實 bulk 數據中的表現同樣出色。
近日,復旦大學生命科學學院及復雜性狀的遺傳調控全國重點實驗室田衛東實驗室在Genome Biology上發表了文章Evaluating deconvolution methods using real bulk RNA-expression data for robust prognostic insights across cancer types。該研究基于真實bulk數據中差異比例細胞類型(即不同 疾病狀態下 下占比發生顯著變化的細胞類型)的相對變化量來評估算法性能。該指標在不同數據集中具有穩健性,且與臨床研究的核心目標高度契合。
![]()
該研究 利用涵蓋 9 種癌癥類型、共 5000 多個 樣本的 18 個真實 bulk RNA 表達隊列,對 5 種主流解卷積方法(含新開發的 ReCIDE )進行三項基準測試: 解卷積結果 與單細胞 RNA 測序( scRNA -seq )結果的一致性、 解卷積結果的 隊列間可重復性、 和 預后相關性可重復性。 結果顯示 ReCIDE 和 BayesPrism 是兩種在 真實 bulk RNA 表達數據上表現最佳的方法。進一步的,作者通過泛癌分析研究了在多種癌癥中與癌癥預后相關的細胞類型 mCAF 。
![]()
該研究為精準腫瘤學提供了實用的解卷積方法選擇依據,同時建立了真實數據驅動的評估體系,助力轉化醫學研究中細胞組成與患者預后關聯的探索。
復旦大學生命科學學院博士研究生李明翰為第一作者,田衛東教授為 論文通訊 作者。
https://link.springer.com/article/10.1186/s13059-026-03942-1
制版人:十一
BioArt
Med
Plants
人才招聘
學術合作組織
(*排名不分先后)
![]()
轉載須知
【非原創文章】本文著作權歸文章作者所有,歡迎個人轉發分享,未經作者的允許禁止轉載,作者擁有所有法定權利,違者必究。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.