引言:時至今日,小 物種基因組文章發一區并不簡單, 2026年1月一篇《Plant Physiology》上的基因組文章,解析了物種 基因組進化歷史 ,闡述了特征性狀的分子機制,是個很好的范例。
測序公司的標準分析不能滿足發表高水平基因組文章的需求。為了讓大家能夠掌握相關的分析技能,自己獨立完成基因組及比較基因組的相關分析工作,組學大講堂制作了《T2T基因組組裝和注釋》、《動植物比較基因組分析實操》兩門課程(提供配套代碼、軟件、分析環境鏡像,兩年售后答疑,贈送練習用云服務器),手把手教你基因組(T2T水平)+比較基因組數據分析,攻克核心分析技術,助力你高效發文章!
掃描下方二維碼開始學習!
至2月6日,購課可享8.8折優惠!
01
課程優勢及內容
組學大講堂是國內領先的生物信息培訓機構,已培訓學員近100000人。本課程有如下優勢:
優勢1:內容全面:涵蓋一區、二區文章常用分析條目,一課掌握核心技能
優勢2:零基礎友好:針對初學者設計,數據整理完善后,復制粘貼即可分析
優勢3:分析不挑設備:采用docker虛擬機教學(國內首創),無需安裝軟件,好學好用
優勢4:電腦要求低:云服務器教學,指令發送由服務器處理,個人電腦可正常辦公
優勢5:售后無憂:2年超長時間售后答疑,學習全程無憂
優勢6:圖表顏值高:緊跟文獻最新趨勢,使用最新R包繪圖,生成高顏值、信息量豐富的圖表,直接用于文章撰寫
02
超豐富的課程內容詳解
↓內容可向下滑動↓
第一節:基因組組裝與注釋文獻通讀
1. 擬南芥:A near-complete assembly of an Arabidopsis thaliana genome
2. 鐘花櫻:The telomere-to-telomere genome of flowering cherry (Prunus campanulata) reveals genomic evolution of the subgenus Cerasus
第二節:linux系統操作基礎+docker工具介紹與使用
1. Linux系統簡介(內核,bash,命令行)
2. 目錄結構與基礎命令(cd, ls, mkdir, rm, chmod)
3. 文件操作與文本處理(grep, awk, sed, less, vim)
4. 認識docker,了解鏡像、容器等概念
5. 熟悉docker鏡像的使用及容器管理
6. 基因組組裝和注釋分析軟件環境搭建
第三節:基因組調研圖
1. Kmer分析原理講解:介紹Kmer的定義,講解Kmer分析的基本原理,包括Kmer分布的統計方法和如何通過Kmer分布推斷基因組大小、重復序列含量等信息。使用Jellyfish等工具對樣本數據進行Kmer分析,展示如何生成Kmer分布圖,并通過圖形解讀基因組的基本特征。
2. 基因組大小與雜合度分析:使用Genomescope2對Kmer分析結果進行處理,展示如何生成基因組調研圖,并解讀圖中的關鍵信息(如基因組大小、雜合度)。
3. 物種倍性:使用Smudgeplot對Kmer數據進行分析。
![]()
第四節:基因組的初步組裝
1. 基因組組裝原理講解:介紹基因組組裝的基本概念,包括重疊法(Overlap-Consensus)和德布魯因圖法(De Bruijn Graph),講解不同組裝策略的優缺點及其適用場景。
2. 三代數據組裝(pacbio HIFI reads):介紹HIFI數據的特點及其在基因組組裝中的優勢,講解Hifiasm工具的工作原理和組裝流程。使用Hifiasm對HIFI測序數據進行組裝,展示如何設置參數、運行程序,并解讀組裝結果。
3. 三代數據組裝(ONT reads):介紹ONT長讀長數據的特點及其在基因組組裝中的應用,講解Nextdenovo工具的功能和組裝策略,介紹Nextpolish工具的作用及其在組裝后拋光中的重要性。使用Nextdenovo對ONT數據進行組裝,使用Nextpolish對組裝結果進行拋光,展示如何提高組裝的準確性和完整性。
4. HiFi與ONT數據的混合組裝
5. HiFi組裝與ONT組裝的合并
第五節:掛載到染色體級別
1. 染色體掛載的理論部分講解:介紹染色體掛載的概念及其在基因組學中的重要性,講解基于參考基因組和Hi-C數據進行染色體掛載的原理和方法。
2. 基于高質量參考基因組的掛載實操(ragtag):介紹Ragtag工具的功能和工作原理,講解如何利用參考基因組進行染色體掛載。使用Ragtag工具將初步組裝的基因組掛載到參考基因組上,展示如何解讀掛載結果,并評估掛載的準確性。
3. 利用ALLHIC基于Hi-C數據進行組裝的掛載
4. 使用3D-DNA手動矯正掛載結果:介紹3D-DNA工具的功能和手動矯正的必要性。使用3D-DNA工具對掛載結果進行手動矯正,展示如何通過可視化工具評估矯正后的掛載質量。
![]()
![]()
第六節:基因組的優化與組裝評估
1. 基于其他組裝或是測序數據進行缺口填充:介紹缺口(Gap)的定義及其對基因組組裝質量的影響。使用GapCloser工具對組裝結果進行缺口填充
2. 使用Nextpolish對填充好的序列拋光
3. 基因組組裝質量評估:介紹基因組組裝質量評估的常用指標(如N50、連續性、準確性、完整性等),講解如何使用工具進行組裝質量評估。使用merqury和BUSCO工具對組裝結果進行全面評估,展示如何解讀評估報告。
![]()
第七節:重復序列與非編碼序列注釋
1. 著絲粒和端粒的注釋:介紹著絲粒和端粒的結構特征及其在基因組中的重要性;講解基于序列特征和生物信息學工具進行預測的原理。使用專門的軟件工具(quarT2T)進行著絲粒和端粒的預測,通過實際案例展示預測結果的解讀方法
2. 重復序列的注釋:闡述重復序列的類型(如衛星DNA、轉座子等)及其在基因組中的分布規律;講解重復序列預測的常用算法和工具。以組裝的基因組為例,使用 LTRFinder、LTRharvest、LTR_retriever、MITE-Hunter、RepeatMasker、TRF軟件進行重復序列的預測,展示如何識別和分類不同類型的重復序列,并分析其在基因組中的占比和分布情況。
3. 非編碼RNA的注釋:介紹非編碼RNA的種類(如rRNA、tRNA、miRNA等)及其生物學功能;講解基于序列保守性和結構特征的非編碼RNA預測方法。使用專門的非編碼RNA預測工具(如tRNAscan-SE、Rfam、rnammer)進行非編碼RNA的預測,通過實際案例展示預測結果
![]()
![]()
第八節:基因結構注釋
1. 從頭注釋:已經有了一個高質量的參考基因組情況下,可以使用liftoff軟件進行基因注釋的遷移,以此作為從頭注釋;如果沒有高質量的基因組,則需要使用SNAP、geneID、glimmerHMM、GeneMark.hmm3、Augustus等軟件進行從頭預測。
2. 同源注釋(GeMoMa):使用GeMoMa將已知蛋白序列比對到目標基因組,預測基因結構。
3. 轉錄組注釋(StringTie、PASA):使用StringTie對RNA-seq數據進行轉錄本組裝,預測基因結構,結合PASA工具將轉錄本比對到基因組,優化基因注釋。
4. 基因功能注釋(eggNOG、uniprot):使用eggNOG對預測的基因進行功能注釋,獲取直系同源基因的功能信息,將預測基因與UniProt數據庫比對,補充功能注釋。
第九節:繪制基因組概覽圖
1. 基因組circos圖:使用MCScanX分析基因組的共線性,生成共線性結果文件,將基因組數據(如基因密度、重復序列分布)和共線性結果繪制為Circos圖,展示如何設置顏色、軌道高度等參數,優化可視化效果。
2. BUSCO評價基因注釋質量:選擇合適的數據庫使用BUSCO對基因組注釋結果進行評估,展示如何解讀BUSCO評估報告,包括完整性、缺失基因和碎片化基因的統計,使用generate_plot.py工具將多個BUSCO評估結果可視化,對比不同數據庫的注釋質量。
![]()
第十節:比較基因組簡單介紹
1. 文獻解讀
2. 基礎知識介紹
3. 分析軟件環境搭建
第十一節:比較基因組與基因家族分析
1. 蛋白序列文件的準備(基因最長蛋白CDS序列提取)
2. OrthoFinder 完成基因家族聚類鑒定分析
3. 不同物種共有基因獨有基因家族韋恩圖、花瓣圖以及柱狀圖的繪制統計
![]()
![]()
![]()
第十二節:物種系統進化分析
1. 系統發育樹構建方法(NJ,ML)講解與核酸替換模型選擇(JC69,K80,HKY85)
2. 單拷貝直系同源基因批量比對合并(ParaAT)
3. trimal比對結果的修剪
4. 串聯法和并聯法構建物種進化樹實操(iqtree、raxml)
第十三節:物種分歧時間分析
1. 進化樹文件和序列比對phy文件的準備
2. 物種分化化石時間點的查找與添加(timetree、figtree)
3. 基于seq like分析物種分歧時間
4. 基于近似似然法(BV)分析物種分歧時間
![]()
第十四節:基因家族收縮或擴張分析
1. 數據準備:不同物種中基因家族數目表、nwk格式超度量樹
2. 利用cafe5使用不同模型進行基因家族收縮擴張分析
3. 基因家族收縮或擴張分析可視化
![]()
第十五節:物種間共線性分析
1. 基于MCScanX進行共線性分析
2. 基于JCVI進行共線性分析
3. 點圖、深度柱狀圖、共線性連線圖以及circos圈圖的繪制
![]()
![]()
![]()
第十六節:物種加倍事件分析
1. 數據準備(4dtv,CDS)
2. 基于ParaAT比對結果進行KaKs分析
3. 基于WGD軟件進行KaKs分析
![]()
掃描下方二維碼聯系我們!
測序、數據分析、課程培訓等事宜請聯系郵箱:Tech@biomics.com.cn
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.