2月6日,廣西大學農學院、廣西甘蔗生物育種實驗室、亞熱帶農業生物資源保護與利用國家重點實驗室張積森團隊牽頭,聯合福建農林大學、云南農科院等單位在上發表了題為“Multiscale pangenome graphs empower the genomic dissection of mixed-ploidy sugarcane species”的研究論文(Research Article)。該研究以廣西大學為第一通訊單位和共同第一作者單位,標志著我國在甘蔗圖泛基因組與多倍體遺傳解析領域取得重大突破。
該研究首次構建了覆蓋現代甘蔗主栽品種及其野生祖先物種的多尺度圖譜泛基因組(super-pangenome graph),在此基礎上系統解析甘蔗復雜混合倍體基因組結構,提出適用于高倍體作物的劑量感知關聯分析(DosageGWAS)新方法,成功鎖定一批與分蘗數、產量、含糖量和葉片角度等重要農藝性狀相關的關鍵基因,并通過CRISPR基因編輯驗證了SaTB1基因顯著促進分蘗、成倍提高甘蔗產量的功能。
這一工作不僅為甘蔗高產優質育種提供了全新的“基因資源地圖”和分析工具,也為小麥、棉花、馬鈴薯等復雜多倍體作物的基因發掘與分子設計育種提供了可直接借鑒的技術路線。
![]()
![]()
甘蔗復雜多倍體圖泛基因組策略提升育種關鍵基因挖掘。
甘蔗基因組為何難解?
甘蔗(Saccharum spp.)是全球最重要的糖料和能源作物之一,提供了世界約 80% 的食糖和 40% 的燃料乙醇。現代栽培甘蔗品種源于高含糖的熱帶種甘蔗(S. officinarum)與高抗逆的野生甘蔗(S. spontaneum)在一個多世紀前的雜交回交,其基因組呈現出極端復雜的結構特征:倍性高達 8–10 倍甚至更高,染色體數目在 100–130 條之間;同源多倍體與異源多倍體成分并存;染色體斷裂、融合和非整倍體現象普遍;重復序列和轉座子高度富集。這些特征使得傳統的單一線性參考基因組難以同時容納不同倍性、不同染色體數和不同遺傳背景,等位基因劑量難以準確區分,測序數據在比對過程中出現大量多重比對和信息丟失等問題。研究指出,傳統“單一線性基因組”范式在甘蔗等復雜多倍體作物中已接近失效,亟需新的基因組參考體系。
解鎖甘蔗超級圖譜密碼
針對上述挑戰,研究團隊構建了多尺度圖譜泛基因組框架。研究選取了覆蓋甘蔗屬及近緣種的 9 套染色體水平基因組,包括野生近緣種斑茅(Erianthus rufipilus)、不同類型的割手密種(S. spontaneum)、熱帶種甘蔗(S. officinarum)代表材料以及3個現代主栽甘蔗品種。研究者通過無參考的染色體“社區”構建方法,將來自不同物種和倍性的染色體按序列相似性劃分為 10個“染色體群落”,對應甘蔗祖先的 10 條原始染色體,建立了跨物種、跨倍性的統一坐標體系。在此基礎上,研究利用圖結構將 47–57 條單倍型路徑壓縮到同一坐標框架中,形成包含約 425.9 萬個節點、累計長度約 14.7Gb的超級泛基因組圖譜。在總體序列長度約 43.2Gb的情況下,該圖譜實現了約 34% 的壓縮率,同時捕獲了約 82% 的甘蔗基因組多樣性,而現有最優單一參考基因組僅能覆蓋約34%。這意味著絕大多數自然變異首次被納入一個統一、可解析的框架中。
![]()
甘蔗屬相關染色體群落與圖泛基因組。
看清多倍體基因調控玄機
在建立統一的圖譜參考體系后,研究團隊以此為基礎構建了開放染色質圖譜、轉錄組圖譜和甲基化圖譜,并與傳統線性參考進行了系統比較。結果顯示,在代表性材料S. officinarum(LA-purple)和S. spontaneum(SES-208)中,圖譜參考在保持總體比對率相當的同時,“唯一比對讀段”比例顯著提升,較單倍體線性參考提高2倍以上,較等位基因級線性參考提高10倍以上,大幅增強了有效信號獲取能力。基于圖譜分析,研究還識別出 6800–19000 余個僅在線性參考中無法檢測的新增開放染色質區域,這些區域富集大量等位變異,揭示了不同物種間轉錄因子結合位點的系統性差異。以關鍵蔗糖轉運基因 1 為例,圖譜顯示家種甘蔗特有的上游開放染色質區域與其更高的基因表達水平和更強的糖分運輸能力高度一致,為等位特異性調控提供了直接證據。在 RNA-seq和全基因組甲基化測序分析中,圖譜同樣顯著提高了讀段比對質量和甲基化位點檢出率。這表明,在高倍體基因組中,圖譜泛基因組是連接“序列多樣性”和“功能調控差異”的更可靠橋梁。
![]()
基于甘蔗屬圖泛基因組的ATAC-seq分析。
馴化足跡與趨同選擇“一網打盡”
依托超級泛基因組,研究團隊對 417 份甘蔗及其近緣材料開展了系統的圖譜比對和群體遺傳分析,材料涵蓋野生甘蔗、家種甘蔗、現代栽培品種及近緣種等多個類群。研究共獲得 774 萬余個高質量SNP,并對等位劑量進行精確估算。群體結構和系統發育分析結果清晰區分了不同物種與雜交群體,證實現代栽培甘蔗中約 70–90% 的遺傳成分來源于熱帶種甘蔗(S. officinarum),并系統量化了不同類群之間的遺傳分化與基因組滲入特征。在此基礎上,研究進一步開展跨種群選擇掃描,重點比較高糖的熱帶種(S. officinarum)與高抗逆的割手密種(S. spontaneum),在全基因組范圍內識別出約 43 Mb的選擇清掃區域。這些區域顯著富集于碳水化合物和淀粉/蔗糖代謝、植株結構發育及抗逆響應等功能通路,鎖定了一批與糖運輸與代謝、株型與分蘗、開花期及逆境適應相關的關鍵候選基因,其中超過一半僅在圖譜分析框架下得以發現。在更大的進化尺度上,研究將甘蔗與同屬黍族的高粱和玉米進行比較,發現甘蔗與高粱之間存在顯著富集的共選基因對,主要涉及碳代謝和激素及脅迫響應通路,而與玉米的共選基因對數量明顯較少。上述結果從群體基因組學層面揭示了“高糖、高生物量型”作物在馴化和改良過程中,圍繞碳代謝和應激響應模塊經歷了高度趨同的人工選擇。
![]()
甘蔗屬群體結構和遺傳多樣性。
基因編輯解鎖甘蔗高產潛能
在眾多候選基因中,研究團隊重點解析了黍族中經典的馴化基因 TB1(TEOSINTE BRANCHED1)。該基因曾驅動玉米由多分枝的野生類型演化為少分枝、高產的現代栽培型,被認為是作物馴化的重要里程碑基因之一。研究發現,在蔗茅(E. rufipilus)、高粱和玉米之間,TB1 所在基因組區域具有高度共線性;在已馴化或栽培的類群中,TB1 周圍的遺傳多樣性顯著下降,表明其在演化過程中受到強烈人工選擇。相比之下,八倍體熱帶種甘蔗(S. officinarum)中 TB1 區域的多樣性下降幅度較小,提示在高倍體背景下,馴化過程中等位基因更難被完全固定,這也與甘蔗仍保持一定分蘗能力的田間表現相一致。為驗證 TB1在甘蔗中的功能,研究團隊利用CRISPR/Cas9技術對熱帶種(S. officinarum)中的 1 進行定向敲除,獲得 21 條不同編輯效率的突變系,其中部分材料的等位協同編輯效率超過80%。與野生型相比,高效突變材料的分蘗數提高約4.0–4.6 倍,分蘗啟動顯著提前,單位面積蔗莖產量提升約 3.8–4.5 倍,且相關性狀與編輯效率呈顯著正相關。研究表明,1 是控制甘蔗分蘗和產量的關鍵馴化基因,傳統馴化未能完全“用盡”其潛力,通過定向基因編輯有望實現產量的跨越式提升。
![]()
基于圖泛基因組的甘蔗群體基因組學分析及其重要農藝性狀趨同選擇研究。
新方法破解復雜多倍體遺傳解析難題
針對多倍體作物中傳統基因組關聯分析(GWAS)難以準確刻畫等位劑量信息的難題,研究團隊在圖譜泛基因組框架下提出了劑量感知關聯分析新方法(DosageGWAS)。該方法依托超級泛基因組和圖結構比對,對等位位點進行連續劑量估算,并在統計模型中綜合考慮不同同源及同源異源染色體上的等位劑量,從而突破了二倍體“0/1/2”模型在混倍體作物中的應用限制。與基于線性參考的常規 GWAS相比,“圖譜 +DosageGWAS”框架顯著提高了關聯分析的靈敏度和解釋力,不僅檢測到更多顯著關聯位點,而且對糖分性狀和葉片角度性狀的遺傳力解釋度由約 0.56/0.58 提升至 0.62/0.78,獨立驗證的劑量差異位點數量也明顯增加。在該框架下,研究成功鑒定出兩個具有代表性的關鍵候選基因。其一是10,位于甘蔗第 9 號染色體約 57Mb區域,在 8 項糖分相關性狀中有 6 項表現出顯著關聯。該基因為水稻細胞壁合成基因10 的同源基因,在甘蔗中,其與高糖相關的衍生等位劑量在馴化過程中呈持續累積和固定趨勢,顯示出明顯的正向選擇信號。其二是 5,作為葉片角度和株型調控的關鍵因子,在第 3 號染色體啟動子區域集中富集多個顯著關聯位點;等位劑量越高,其表達水平越低,對應葉片越直立,相關有利等位在現代栽培甘蔗中顯著富集,說明株型改良已成為近現代育種的重要方向之一。上述結果證明,在混倍體作物中精確量化“等位劑量”并納入統計模型,是打破“隱匿遺傳力”和提升關聯分析信號的關鍵。
![]()
基于圖泛基因組的劑量GWAS分析與關鍵位點挖掘。
跨作物推廣的技術突破
為驗證方法的普適性,研究團隊將這一多尺度圖譜泛基因組策略推廣至異源多倍體小麥、棉花以及同源多倍體馬鈴薯等多倍體物種。通過對這三類典型多倍體作物構建圖譜超級泛基因組并進行比對,結果顯示,構建的圖譜超級泛基因組能夠捕獲約 94–97% 的基因組多樣性,遠高于最佳單一參考基因組的 48–65%,同時顯著提升了讀段比對質量,彌補了因結構變異而丟失的多樣性信息。在馬鈴薯小規模GWAS實驗中,該方法同樣提升了關聯信號和遺傳力解釋度。這表明,“多尺度圖譜 + 劑量感知GWAS”框架不僅適用于甘蔗,也可跨物種、跨多倍體作物廣泛推廣,為復雜作物基因組研究和分子育種提供通用工具。
![]()
多尺度圖泛基因組策略同樣適用于異源多倍體(小麥、棉花)與同源多倍體(馬鈴薯)。
為復雜作物“換代”鋪路
長期以來,現代甘蔗育種高度依賴有限的親本材料,遺傳基礎狹窄、種質資源利用不足,制約了產量和抗逆性進一步提升。本研究構建的甘蔗多尺度圖譜泛基因組及配套分析流程,有望在多個層面加速育種進程。一是支撐高質量分子標記開發與基因組預測。該體系提供了劑量精確、結構信息豐富的大規模變異數據,可設計適用于多倍體的單劑量標記和高密度芯片,并將劑量感知信息納入基因組預測模型,有望顯著提高多倍體作物的選擇準確度,加快早代材料淘汰和優系篩選。二是高效挖掘野生與稀有優良等位。依托圖譜開展跨物種比較和群體掃描,可快速鎖定來源于野生近緣種或地方品種的抗病、抗逆、高糖、高纖維等優良等位,為“回交導入+基因編輯”提供精準靶點。三是為未來“甘蔗泛基因組聯盟”奠定基礎。隨著中國種、印度種等歷史品種和區域性地方品種基因組的不斷發布,現有甘蔗屬超級泛基因組可持續擴展,逐步形成覆蓋全球甘蔗種質的動態演進型“甘蔗基因資源基礎設施”。
研究團隊同時指出,圖譜泛基因組仍面臨轉錄組標準化分析工具不足、復雜重復區域的計算效率,以及不同同源或同源異源拷貝間拷貝數與表達定量缺乏統一標準等挑戰。隨著相關算法、比對軟件和下游分析工具的持續發展,圖譜泛基因組有望逐步取代單一線性參考,成為復雜作物基因組學與分子育種的新型基礎設施。
研究成果系統突破了多倍體遺傳解析的關鍵技術瓶頸,精準定位了分蘗、糖分等一批重要農藝性狀相關基因及其調控元件,并已直接服務于甘蔗高糖、高產分子育種實踐。在百余份材料中完成糖分性狀關聯分析,在遺傳多樣性捕獲、關鍵性狀定位和育種靶標挖掘等方面取得顯著成效,為多倍體作物分子設計育種提供了核心技術支撐,應用前景廣闊。
本研究得到國家重點研發計劃、國家自然科學基金、廣西科技重大專項、廣西重點研發計劃等多個項目的聯合資助。
專家點評
從甘蔗到復雜多倍體作物:圖泛基因組引領復雜基因組育種新時代
韓斌(中國科學院院士)
張積森團隊在發表于《》的研究工作中(Huang et al., 2026),構建了首個面向混合倍性甘蔗種質的多尺度圖泛基因組,統一整合了多個物種和數十條單倍型信息,實現了在同一坐標系下對結構變異、拷貝數差異及劑量敏感位點的精確表征。
該研究不僅徹底改寫了人們對甘蔗基因組“不可解”的傳統認知,還為將甘蔗這一高復雜度基因組作物推進至可設計育種提供了一條通用技術路線,為小麥、苜蓿、馬鈴薯等復雜多倍體作物的精準改良提供了重要范式。
突破多倍體基因組解析極限,引領甘蔗育種新范式
劉耀光(中國科學院院士)
甘蔗作為全球重要的糖料和能源作物,被視為植物基因組學中最難解析的作物之一。本研究提出的圖超泛基因組構建通用策略同樣適用于其它植物同源多倍體(如小麥、棉花)和自交多倍體(如馬鈴薯),可在統一框架下區別處理不同倍性類型,為混合倍性作物組學研究和分子育種提供可復制的技術藍本與系統性方法范式。
我國是甘蔗種植與蔗糖生產大國,保障糖業安全關乎國計民生。該成果不僅在甘蔗基礎研究領域鞏固和提升了我國的國際引領地位,也為其他多倍體作物的分子育種提供了系統技術支撐,彰顯了從基礎前沿突破到產業關鍵問題解決的貫通式創新,對推動我國甘蔗種業振興與糖業高質量發展具有重要示范意義。
甘蔗異源多倍體遺傳解析與分子育種的新范式
張獻龍(中國工程院院士)
張積森團隊在近期發表于《》的研究(Huang et al., 2026)中構建了面向混合倍性甘蔗種質的多尺度圖泛基因組,將不同物種來源、不同拷貝數及劑量狀態的單倍型統一映射到同一坐標系,為異源多倍體“還原”出一個可計算、可推理的遺傳框架。
通過將代表基因功能驗證與圖泛基因組解析緊密銜接,該研究為甘蔗這一“非整體”的復雜多倍體基因組建立了可操作的遺傳—育種路徑,突破了復雜多倍體領域長期懸而未解的關鍵難題,也為復雜多倍體作物在真實劑量背景下開展精細遺傳改良提供了可推廣的技術范式。

來源丨農學院
編稿丨覃靖雯
排版丨周灝
責編丨葉維佶 陳喜 覃靖雯 谷雯琴
初審丨韋俞妃 黎錦
審核丨歐陽雄姣 楊璞
審定丨孫瑞
出品丨黨委宣傳部
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.