本次訓(xùn)練營(yíng)面向的是《純生信公共數(shù)據(jù)庫(kù)挖掘”型論文復(fù)現(xiàn)與遷移》:不需要做任何濕實(shí)驗(yàn)、不依賴(lài)自建隊(duì)列,只需從公開(kāi)數(shù)據(jù)把研究做成一篇可發(fā)表的機(jī)制文章。我們將以公共 bulk轉(zhuǎn)錄組/單細(xì)胞數(shù)據(jù) + GWAS/eQTL為核心,教你把“現(xiàn)象關(guān)聯(lián)”升級(jí)為“因果證據(jù)”,把“群體層面的信號(hào)”落到“細(xì)胞類(lèi)型與細(xì)胞狀態(tài)”上,用一條清晰的證據(jù)鏈完成從選題到主圖的全流程。
課程最核心的亮點(diǎn)是孟德?tīng)栯S機(jī)化(MR)+ 單細(xì)胞(scRNA-seq)/細(xì)胞互作:先在公共轉(zhuǎn)錄組中篩出穩(wěn)健候選,再通過(guò)eQTL–GWAS 的 MR建立“基因/暴露→疾病”的方向性因果關(guān)系,解決最頭疼的“只是相關(guān)、說(shuō)服力不夠”的問(wèn)題;隨后把 MR 鎖定的關(guān)鍵基因帶入單細(xì)胞數(shù)據(jù),完成細(xì)胞類(lèi)型定位、表達(dá)分布、軌跡變化與細(xì)胞通訊,讓結(jié)論從“一個(gè)基因可能有關(guān)”變成“哪個(gè)細(xì)胞在什么時(shí)候通過(guò)什么互作通路驅(qū)動(dòng)表型”。
最終學(xué)員將獲得一套可復(fù)制到任何疾病方向的公共數(shù)據(jù)庫(kù)發(fā)文模板:MR 提因果、單細(xì)胞給機(jī)制、主圖可交付,讓沒(méi)有實(shí)驗(yàn)條件也能做出審稿人認(rèn)可的研究閉環(huán)。
論文介紹
本次復(fù)現(xiàn)的論文如下
![]()
https://www.sciencedirect.com/science/article/pii/S227458072500041X01
課程特色
1. 純公共數(shù)據(jù)庫(kù)發(fā)文閉環(huán):無(wú)實(shí)驗(yàn)也能做出“可投稿”的研究鏈路
不需要濕實(shí)驗(yàn)、不依賴(lài)自建隊(duì)列,全程基于GEO等轉(zhuǎn)錄組數(shù)據(jù) + IEU OpenGWAS/finngen 等結(jié)局?jǐn)?shù)據(jù) + eQTLGen 等 eQTL 數(shù)據(jù) + 單細(xì)胞公開(kāi)數(shù)據(jù)完成從選題到主圖的閉環(huán)。重點(diǎn)教你把公共數(shù)據(jù)“挖深、挖實(shí)、挖出因果證據(jù)”,讓臨床醫(yī)生/在讀博士也能用公共數(shù)據(jù)做機(jī)制文章。
2. 全流程系統(tǒng)教學(xué):從公共數(shù)據(jù)下載到主圖交付的“保姆級(jí)模板工程”
不是零散技巧,而是完整工程化流程:數(shù)據(jù)下載→清洗與樣本信息→差異/交集→富集與網(wǎng)絡(luò)→MR(含敏感性)→模型驗(yàn)證(ROC等)→GSEA/免疫浸潤(rùn)→調(diào)控網(wǎng)絡(luò)→單細(xì)胞注釋/軌跡/通訊。配套可復(fù)跑代碼模板、參數(shù)表、驗(yàn)收清單,確保每節(jié)課都有明確輸出的圖表。
3.AI賦能遷移到你自己的方向:從“復(fù)現(xiàn)一篇”到“復(fù)制一類(lèi)文章”
課程交付的不只是這篇文章的復(fù)現(xiàn)結(jié)果,而是一套可遷移的“公共數(shù)據(jù)庫(kù)發(fā)文框架”:換疾病、換組織、換表型,也能快速套用流程,形成你自己的可復(fù)用代碼庫(kù)與套路模板。后續(xù)做自己的課題時(shí),遇到數(shù)據(jù)選擇、MR 工具變量、單細(xì)胞驗(yàn)證、圖形呈現(xiàn)等問(wèn)題,都有針對(duì)性的遷移指導(dǎo)思路。
4.直播授課 + 錄屏回看 + 長(zhǎng)期答疑:
直播課實(shí)時(shí)互動(dòng)、課后錄屏反復(fù)看,資料包(代碼/講義數(shù)據(jù)/出圖模板)全配齊;課程結(jié)束答疑不結(jié)束,后續(xù)自己數(shù)據(jù)分析過(guò)程中遇到問(wèn)題也是一對(duì)一指導(dǎo)答疑,真正做到包教包會(huì),學(xué)有所用做出更有價(jià)值的研究成果。
5.一對(duì)一指導(dǎo) + 包教包會(huì):
七名全職的答疑助理,從早上八點(diǎn)到晚上十二點(diǎn)全天在線(xiàn) ,365天全年無(wú)休的一對(duì)一答疑,實(shí)打?qū)嵄WC一對(duì)一指導(dǎo)的學(xué)習(xí)效率。
課程結(jié)束答疑不結(jié)束,后續(xù)自己數(shù)據(jù)分析過(guò)程中遇到問(wèn)題也是一對(duì)一指導(dǎo)答疑,確保學(xué)完能直接上手課題,讓你真正學(xué)得會(huì)、用得上、挖掘公共數(shù)據(jù)庫(kù)完成自己的科研成果。
02
課程時(shí)間
一個(gè)月系統(tǒng)教學(xué),實(shí)打?qū)嵃贪鼤?huì)
每周二、周四和周日晚19:00-22:00
共十五節(jié)課
十二節(jié)課程精講,三節(jié)課答疑和總結(jié)
03
課程核心模塊
第一節(jié)課:AI + 公共數(shù)據(jù)庫(kù)發(fā)文范式解讀:從“相關(guān)性堆結(jié)果”到“MR×單細(xì)胞的因果機(jī)制證據(jù)鏈”
基于 Deepseek 高效精讀“公共數(shù)據(jù)庫(kù)挖掘型論文”
用 Deepseek 快速拆解這類(lèi)文章最核心的發(fā)文邏輯:為什么只靠公開(kāi)數(shù)據(jù)也能寫(xiě)出“機(jī)制感”、怎樣把多隊(duì)列/多數(shù)據(jù)庫(kù)拼成一條可信的證據(jù)鏈、創(chuàng)新點(diǎn)通常落在哪里(因果、機(jī)制落點(diǎn)、外部驗(yàn)證、可解釋性)。
Deepseek 拆解論文敘事框架:一條可復(fù)用的“公共數(shù)據(jù)因果鏈”
從“提出臨床/生物學(xué)問(wèn)題”開(kāi)始 → 公共轉(zhuǎn)錄組多隊(duì)列發(fā)現(xiàn)與穩(wěn)健驗(yàn)證 → 富集/網(wǎng)絡(luò)鎖定候選 →eQTL–GWAS MR 建立方向性因果(不是相關(guān))→ 敏感性分析自證可靠 →單細(xì)胞定位到細(xì)胞類(lèi)型/狀態(tài)→ 軌跡/通訊補(bǔ)齊“誰(shuí)在驅(qū)動(dòng)、如何互作”的機(jī)制解釋 → 形成可投稿的主圖敘事閉環(huán)。
ChatGPT:把這套范式遷移到你的疾病方向(選題到主圖規(guī)劃)
現(xiàn)場(chǎng)示范如何用 ChatGPT 做“可發(fā)文選題設(shè)計(jì)”:
1)如何選合適的公共數(shù)據(jù)組合(表達(dá)隊(duì)列/結(jié)局GWAS/eQTL/scRNA)
2)如何定義暴露與結(jié)局、提前規(guī)劃 MR 的可行性(IV數(shù)量、組織匹配、方向)
3)如何把“MR結(jié)果”落到單細(xì)胞的驗(yàn)證任務(wù)(要看哪些細(xì)胞、哪些狀態(tài)、哪些互作)
![]()
第二節(jié)課:公共數(shù)據(jù)處理和差異分析
1.從GEO數(shù)據(jù)庫(kù)下載芯片數(shù)據(jù),整理為訓(xùn)練集
2.下載RNAseq數(shù)據(jù)進(jìn)行臨床分組信息,整理為驗(yàn)證集表達(dá)矩陣
3.數(shù)據(jù)預(yù)處理:探針注釋、重復(fù)基因合并、缺失處理
4.每個(gè)樣本 QC、數(shù)據(jù)標(biāo)準(zhǔn)化和批次效應(yīng)處理
5.limma包進(jìn)行差異分析:得到表達(dá)差異 DEGs, 作為候選基因
第三節(jié)課:功能富集與蛋白互作網(wǎng)絡(luò):PPI/關(guān)鍵節(jié)點(diǎn)篩選(“把故事講成機(jī)制”)
1.多隊(duì)列一致性驗(yàn)證:方向一致、顯著性一致、可視化一致
2.GO、KEGG和Reactome 富集:顯著通路篩選與可視化
3.GSEA 通路富集分析:從“基因列表”到“通路級(jí)解釋”的轉(zhuǎn)換
4.STRING 構(gòu)建 PPI 網(wǎng)絡(luò):導(dǎo)出網(wǎng)絡(luò)文件 + Cytoscape 可視化
5.網(wǎng)絡(luò)關(guān)鍵節(jié)點(diǎn)(hub)與模塊(cluster)篩選:構(gòu)建“機(jī)制候基因”
形成“基因—通路—網(wǎng)絡(luò)”三層證據(jù)材料
![]()
第四節(jié)課:eQTLGen數(shù)據(jù)庫(kù)構(gòu)建孟德?tīng)栯S機(jī)化的工具變量(IVs)
1.從eQTLGen數(shù)據(jù)庫(kù)下載Significant cis-eQTLs
2.閾值篩選與暴 露顯著相關(guān)的 SNP
3.進(jìn)行 連鎖不平衡去相關(guān),確保保留的 SNP 彼此獨(dú)立
4.過(guò)濾弱工具變量, 滿(mǎn)足與暴露因子顯著相關(guān)且與結(jié)局變量相互獨(dú)立
![]()
第五節(jié)課:基于 eQTL 暴露與疾病 GWAS 多基因孟德?tīng)栯S機(jī)化分析
1.將暴露數(shù)據(jù)與疾病結(jié)局?jǐn)?shù)據(jù)統(tǒng)一轉(zhuǎn)換為 outcome/exposure 標(biāo)準(zhǔn)格式
2.用 SNP 取暴露與結(jié)局的交集,生成 SNP 的結(jié)局?jǐn)?shù)據(jù)表
3.每個(gè)基因?qū)?yīng)的暴露子集做等位基因方向一致化
4.MR 分析并做異質(zhì)性、多效性、單 SNP、留一法等敏感性檢驗(yàn)
第六節(jié)課:篩選有意義的暴露因素和基因單獨(dú)做孟德?tīng)柗治?/p>
1.讀取 MR 的全量結(jié)果,只保留IVW 方法p值顯著的結(jié)果
2.顯著暴露再做OR 方向一致性篩選,確保同一暴露在不同方法下效應(yīng)方向一致
3.多效性(pleiotropy)與異質(zhì)性(heterogeneity)結(jié)果按照 p 值進(jìn)行篩選
4.用最終 IVW 篩出的暴露(基因)列表反向過(guò)濾 eQTL 數(shù)據(jù),得到“高可信 IV 集合”
5.篩選出有意義的基因后,單獨(dú)對(duì)每個(gè)基因做孟德?tīng)栯S機(jī)化分析
![]()
第七節(jié)課:診斷與預(yù)測(cè)能力驗(yàn)證:ROC/AUC + 多指標(biāo)對(duì)比
1.單基因 ROC 與多基因聯(lián)合 ROC:訓(xùn)練集 + 驗(yàn)證集 AUC 比較
2.交叉驗(yàn)證/重復(fù)抽樣:避免偶然高 AUC 的偽結(jié)果
3.校準(zhǔn)曲線(xiàn)與分層分析:不同亞組/不同批次下穩(wěn)定性評(píng)估
4.Nomogram 構(gòu)建與可解釋輸出:讓臨床讀者看得懂、用得上
5.DCA 決策曲線(xiàn):補(bǔ)齊臨床凈獲益證據(jù)(文章結(jié)構(gòu)更完整)
![]()
第八節(jié)課:機(jī)制挖掘一:?jiǎn)位?核心基因的通路機(jī)制(GSEA / GSVA)
1.按核心基因表達(dá)分組構(gòu)建比較框架
2.單基因 GSEA(KEGG/Hallmark):輸出標(biāo)準(zhǔn)化 NES、p.adjust、核心富集基因
3.GSVA 打分:把通路活性轉(zhuǎn)成樣本級(jí)矩陣,便于畫(huà)圖與統(tǒng)計(jì)
4.與臨床分組/表型關(guān)聯(lián):把通路變化寫(xiě)成 機(jī)制解釋段落
5.輸出 核心基因→關(guān)鍵通路 的主圖級(jí)圖組(GSEA曲線(xiàn) + 通路熱圖等)
![]()
第九節(jié)課:機(jī)制挖掘二:免疫浸潤(rùn)與炎癥環(huán)境(ssGSEA/多算法交叉驗(yàn)證)
1.免疫細(xì)胞基因集準(zhǔn)備與 ssGSEA 打分(GSVA)
2.免疫細(xì)胞差異比較:疾病組 vs Control 分層比較
3.核心基因與免疫細(xì)胞相關(guān):Spearman 相關(guān) + 熱圖/散點(diǎn)回歸
4.多算法交叉驗(yàn)證:xCell/EPIC/CIBERSORT 思路與結(jié)果一致性檢查
5.輸出 基因—免疫—通路 三聯(lián)證據(jù)圖,補(bǔ)齊審稿人常問(wèn)的免疫解釋
第十節(jié)課:調(diào)控與關(guān)聯(lián):ceRNA 網(wǎng)絡(luò) + 疾病/藥物關(guān)聯(lián)(公共數(shù)據(jù)庫(kù)可完成)
1. miRNA 靶向預(yù)測(cè)(如 miRTarBase/TargetScan 思路)得到 miRNA–mRNA 對(duì)
2. lncRNA–miRNA 關(guān)聯(lián)(如 starBase 思路)補(bǔ)齊上游調(diào)控
3.構(gòu)建 lncRNA–miRNA–mRNA(ceRNA)網(wǎng)絡(luò):導(dǎo)出邊表/節(jié)點(diǎn)表并可視化
4.疾病關(guān)聯(lián)/證據(jù)補(bǔ)齊(如 CTD 思路):核心基因與疾病關(guān)聯(lián)排名展示
5.輸出 調(diào)控網(wǎng)絡(luò)圖 + 疾病關(guān)聯(lián)圖 ,讓文章從 結(jié)果 變成 更像機(jī)制論文
![]()
第十一節(jié)課:?jiǎn)渭?xì)胞驗(yàn)證一:把 MR 基因落到具體的細(xì)胞類(lèi)型上
1.下載單細(xì)胞數(shù)據(jù)與注釋信息:建立可復(fù)用對(duì)象(Seurat 對(duì)象)
2.QC、歸一化、高變基因、降維聚類(lèi):標(biāo)準(zhǔn)化流程與關(guān)鍵參數(shù)
3.細(xì)胞類(lèi)型注釋?zhuān)簃arker 規(guī)則 + 自動(dòng)注釋?zhuān)⊿ingleR和ScType 思路)+ 人工校正
4.核心基因在細(xì)胞類(lèi)型中的表達(dá):FeaturePlot/VlnPlot/DotPlot
5.輸出 關(guān)鍵基因在哪些細(xì)胞表達(dá)、差異在哪些細(xì)胞最明顯 的主圖證據(jù)
![]()
第十二節(jié)課:?jiǎn)渭?xì)胞驗(yàn)證二:軌跡推斷 + 細(xì)胞通訊(把機(jī)制寫(xiě)成 誰(shuí)驅(qū)動(dòng)、如何互作 )
1.選定關(guān)鍵細(xì)胞亞群:基于標(biāo)記基因與表型差異進(jìn)行聚焦
2.軌跡分析(Monocle2 和 3/scVelo):狀態(tài)轉(zhuǎn)變與關(guān)鍵節(jié)點(diǎn)解釋
3.核心基因沿軌跡變化:把因果基因接到狀態(tài)變化上
4.細(xì)胞通訊分析(CellChat):差異互作通路與配體/受體細(xì)胞識(shí)別
5.文章化交付:把 MR + 單細(xì)胞結(jié)果整理為 可投稿的主圖敘事順序 + 圖注要點(diǎn) + 結(jié)果段落模板
![]()
04
課程費(fèi)用
課程費(fèi)用2880元,醫(yī)咖會(huì)會(huì)員優(yōu)惠價(jià)2500元,含直播授課+課程錄屏反復(fù)回看和一對(duì)一指導(dǎo)答疑,含 講義、代碼、數(shù)據(jù)等完整資料包。
七名全職的答疑助理,從早上八點(diǎn)到晚上十二點(diǎn)全天在線(xiàn) ,365天全年無(wú)休的一對(duì)一答疑,實(shí)打?qū)嵄WC一對(duì)一指導(dǎo)的學(xué)習(xí)效率。
聯(lián)系人:小咖3號(hào)
微信號(hào):xys2019ykh
掃碼添加小咖3號(hào)
05
課程收獲
一、MR 提因果、單細(xì)胞給機(jī)制:把“相關(guān)”升級(jí)為“方向性證據(jù)”
課程核心思路是 eQTL–GWAS 的孟德?tīng)栯S機(jī)化(MR)與scRNA-seq 單細(xì)胞定位/狀態(tài)/互作的強(qiáng)組合:
1.MR 解決“到底是不是因果、方向是什么、證據(jù)強(qiáng)不強(qiáng)”;
2.單細(xì)胞解決“這個(gè)因果基因到底在哪類(lèi)細(xì)胞、處于什么狀態(tài)、通過(guò)什么互作通路影響疾病”。
3.最終形成審稿人最認(rèn)可的“因果證據(jù)鏈 + 細(xì)胞機(jī)制落點(diǎn)”。
二、論文級(jí)作圖與審稿邏輯:每張圖都講“怎么做 + 為什么這樣做 + 怎么被追問(wèn)也不怕”
1.除了把圖畫(huà)出來(lái),更強(qiáng)調(diào)“圖背后的統(tǒng)計(jì)與生物學(xué)邏輯”:
2.閾值怎么設(shè)、批次/混雜怎么處理、MR 的異質(zhì)性/多效性怎么解釋、單細(xì)胞注釋怎么自證、通訊/軌跡怎么避免過(guò)度解讀……讓你不僅能跑通代碼,還能深刻理解代碼背后的基本原理。
三、從“只會(huì)跑差異/畫(huà)熱圖”到“做出因果+機(jī)制閉環(huán)的公共數(shù)據(jù)庫(kù)文章”
將親手完成一篇純生信公共數(shù)據(jù)庫(kù)挖掘論文的全流程復(fù)現(xiàn):從 GEO 多隊(duì)列數(shù)據(jù)下載與清洗,到差異與富集、網(wǎng)絡(luò)分析,再到eQTL–GWAS 孟德?tīng)栯S機(jī)化(MR)建立方向性因果證據(jù),最后用單細(xì)胞數(shù)據(jù)把因果基因落到具體細(xì)胞類(lèi)型/狀態(tài)/互作機(jī)制。
1.不是做出一些結(jié)果,而是把每一步變成可交付的證據(jù)鏈:相關(guān)→因果→細(xì)胞定位→機(jī)制解釋→主圖呈現(xiàn)。
2.學(xué)完能做到:看到一篇公共數(shù)據(jù)庫(kù)文章,知道它的關(guān)鍵數(shù)據(jù)來(lái)源是什么、每張圖背后的統(tǒng)計(jì)邏輯是什么、MR 怎么做才站得住、單細(xì)胞怎么做驗(yàn)證才不空泛,并且能把同樣結(jié)構(gòu)遷移到自己的疾病方向。
四、真正掌握公共數(shù)據(jù)庫(kù)發(fā)文的頂刊核心方法體系
本次訓(xùn)練營(yíng)的核心能力不是工具堆疊,而是建立一套可復(fù)用的方法框架:
多隊(duì)列一致性驗(yàn)證體系:訓(xùn)練集發(fā)現(xiàn) → 外部驗(yàn)證集復(fù)核 → 結(jié)果穩(wěn)健性與可重復(fù)性
1.MR 因果推斷體系:IV 篩選、LD 去相關(guān)、F-stat 強(qiáng)度、異質(zhì)性/多效性/LOO 敏感性分析,形成“因果證據(jù)”而非“相關(guān)猜想”
2.機(jī)制補(bǔ)全體系:GSEA/通路、免疫浸潤(rùn)(ssGSEA/GSVA)、網(wǎng)絡(luò)推斷與關(guān)聯(lián)分析,把結(jié)論寫(xiě)成“審稿人追問(wèn)也不怕”的邏輯鏈
3.單細(xì)胞落地體系:把 MR 鎖定的關(guān)鍵基因放回細(xì)胞層面,回答“哪類(lèi)細(xì)胞在驅(qū)動(dòng)?在什么狀態(tài)變化?通過(guò)什么互作/通訊影響表型?”
五、讓沒(méi)有實(shí)驗(yàn)條件的醫(yī)生/博士,也能“獨(dú)立做出可投稿的機(jī)制文章”
很多臨床研究者的瓶頸不在于不會(huì)畫(huà)圖,而在于兩件事:
1)結(jié)果容易停在“相關(guān)性”,缺乏說(shuō)服力;
2)機(jī)制容易停在“泛泛解釋”,缺少細(xì)胞層面的落點(diǎn)。
這門(mén)課會(huì)讓你把公共數(shù)據(jù)真正用起來(lái):
1.用MR把“關(guān)聯(lián)”升級(jí)為“方向性因果證據(jù)”
2.用單細(xì)胞把“候選基因”落到“細(xì)胞類(lèi)型—細(xì)胞狀態(tài)—細(xì)胞互作”的機(jī)制鏈條
3.用規(guī)范化的出圖與寫(xiě)作結(jié)構(gòu),把證據(jù)鏈做成審稿人一眼認(rèn)可的主圖級(jí)敘事
總結(jié) :
一套可復(fù)跑的工程化代碼庫(kù)(從下載到出圖全鏈路)
一套可遷移的“公共數(shù)據(jù)庫(kù)發(fā)文模板”(換疾病/換表型也能快速?gòu)?fù)用)
一套完整主圖結(jié)果:MR 因果圖 + 單細(xì)胞定位 + 通路/免疫/網(wǎng)絡(luò)支撐圖
一套“從結(jié)果到論文敘事”的寫(xiě)作骨架:能把分析寫(xiě)成文章,而不是只留在PPT
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.