NEWS
新聞資訊
|
項目文章|Nature Commun&ChIP再立功——CENH3-ChIP輔助橡膠T2T基因組組裝橡膠樹(Hevea brasiliensis)是全球99%的天然橡膠(NR)的來源,其獨特的物理特性在各個工業領域中發揮著關鍵作用。然而,在馴化初期快速增加之后,橡膠產量似乎很難再進一步提高。育種者將產量停滯的原因歸結為遺傳多樣性有限,因為現代橡膠克隆品種主要源自僅有的九棵祖先樹。為應對這一挑戰,研究人員采用了先進的基因組學方法。最近的基因組研究揭示了野生橡膠樹通過人工選擇逐漸進化為高產克隆體的過程。這些從高質量基因組數據中得出的見解對于精確和高效育種至關重要。然而,現有的基因組組裝中存在較大的缺口和未解決的復雜區域,限制了這些基因組工具的準確性和有效性。 迄今為止,已有多個橡膠樹的基因組得以公布。這些顯著的進步為橡膠樹的遺傳研究和克隆改良提供了關鍵的數據資源。目前,所有公布的基因組序列均未進行單倍型解析。此外,這些組裝體中大量的gap降低了數據的完整性,并阻礙了對復雜基因組區域的分析。值得注意的是,像端粒和著絲粒這樣的關鍵區域在這些基因組中仍未得到解決。
近日,中國熱帶農業科學院的程漢研究員和中國熱帶農業科學院/深圳基因組所的周永鋒老師團隊聯合構建了在廣泛種植的橡膠品種CATAS 7-33-97中的單倍型且T2T gap-free的參考基因組。全面的T2T基因組為揭示復雜基因組的頑固結構特征邁出了重要一步,并突顯了先前被忽視的單倍型之間的結構變異。此外,T2T橡膠基因組使人們能夠分析與橡膠生產相關的基因的進化過程,并揭示了與割膠反應相關的橡膠生物合成調控網絡。愛基百客提供了部分技術支持。
割膠刺激下橡膠生物合成機制
一、橡膠樹單倍型T2T參考基因組的組裝 本研究生成了122 X coverage的HiFi reads、414 X coverage的Hi-C reads以及314 X coverage的超長ONT reads,用于組裝CATAS 7-33-97基因組。通過整合數據,組裝了兩個gap-free的單倍型,每個單倍型的大小為1.56GB。hapA和hapB的contig N50分別達到93.64 Mb和94.38 Mb;基于k-mer的基因組完整性評估值為97.5%;BUSCO基因完整性分析顯示hapA和hapB分別達98.8%和99%;LAI值分別為16.45(hapA)和16.7(hapB);質量值(QV)分別為65.52和65.72,證實了組裝的T2T基因組的高質量。hapA和hapB的基因組均表現出高度相似的重復序列組成,其中84.63%和84.53%被識別為重復序列,長末端重復序列(LTR)在這些序列中占主導地位(hapA中為76.56%;hapB中為76.33%)。 為了確定橡膠基因組中的著絲粒區域,作者使用CENH3抗體進行了ChIP-Seq檢測(2個重復)。通過篩選每條染色體上的峰,作者確定了每條染色體上的著絲粒區域,著絲粒存在多個具有不同周期的TR序列,由單一的高重復TR序列構成。通過檢測所有染色體上的7個堿基的端粒重復序列(CCCTAAA/TTTAGGG)來識別端粒。 在CATAS 7-33-97基因組的兩個等位基因型之間發現了多種變異。其中71.46%的SNP位于基因間區域,僅有3.5%位于外顯子區域。為了評估等位基因A和等位基因B之間的插入缺失(InDel)對基因組雜合性的影響,作者篩選了超過100bp的結構變異,并在18對染色體上發現了6330個InDel。對InDel的注釋表明,大多數InDel位于非編碼區域,只有114個位于外顯子。令人驚訝的是,在chr8染色體對之間發現了一個32.71Mb的多結構變異(sv33M)區域(20588014-53302788),其特征是眾多結構變異事件。值得注意的是,在野生型(MT/VB/25A 57/8)和栽培克隆(CATAS8-79)的chr8相應區域中觀察到了高度的變異。這證明了橡膠樹中同源染色體之間的大型結構變異,sv33M在橡膠樹的進化過程中可能具有不同的遺傳作用。
圖1 CATAS 7-33-97的表型和基因組特征
表1 橡膠基因組組裝統計數據 二、大戟科橡膠生成相關基因的比較基因組學研究 T2T基因組能夠對與橡膠生產相關的基因進行詳細的進化研究。為了確定與橡膠生產相關的同源基因,作者收集了含橡膠樹在內的九個物種(其它是擬南芥、杜仲、木薯、水稻、毛果楊、蓖麻、橡膠草和葡萄)的基因組。總共分類出了27,311個直系同源群,占總基因數的89.7%,其中8364個直系同源群存在于所有物種中。與產量低的野生橡膠基因組(MT/VB/25A57/8)相比,CATAS 7-33-97表現出1297個擴張的直系同源群和662個收縮的直系同源群。功能富集分析表明擴張的基因家族與創傷響應、萜類生物合成、烴代謝、茉莉酸反應以及脂質代謝有關,表明這些基因家族的擴增可能與橡膠產量有關,因為橡膠是在植物受傷后產生的,并且需要通過從蔗糖中合成萜類物質來補充。而收縮基因主要富集在苯甲酸代謝過程、毒素分解過程、對活性氧的反應以及硫化合物代謝過程中。這表明收縮基因可能通過下調與防御相關的途徑來優化用于橡膠生物合成的資源分配。 為了進一步研究大戟科植物中橡膠生物合成基因的進化情況,作者收集了7個大戟科物種的基因組(2種橡膠產量較低的植物以及5個橡膠樹)。在這些植物中,與橡膠生物合成相關的基因可分為4類:MVA途徑基因、MEP途徑基因、起始合成基因和橡膠延伸基因。其中橡膠延伸類基因在橡膠樹中的數量顯著高于蓖麻和木薯,表明該基因家族的擴張是高產膠能力的關鍵。 橡膠延伸因子(REF)和橡膠小顆粒蛋白(SRPP)基因被認為是最重要的橡膠生產基因。在該CATAS 7-33-97基因組中,共鑒定出19個REF/SRPP基因,并揭示了橡膠樹中額外的SRPP,即HbSRPP11。在野生橡膠樹(MT/VB/25A57/8)中,作者在基因組中僅鑒定出5個REF和9個SRPP基因,而蓖麻屬和木薯屬中未鑒定出REF基因,鑒定出3個和5個SRPP基因。表明REF/SRPP基因的數量與橡膠生產能力相關。對REF和SRPP基因進行了系統發育分析發現SRPP基因被分為四個簇,而REF基因則被分為三個簇,這表明REF和SRPP亞群可能是通過基因重復事件產生的,隨后趨同進化形成獨立功能亞型。此外,橡膠樹的CPT基因數量明顯多于蓖麻和木薯,表明其在促進乳膠產量方面發揮著重要作用。
圖2 大戟科橡膠生成基因的進化與多樣性 三、橡膠樹等位基因特異性表達(ASE)的穩定性特征 利用CATAS 7-33-97的轉錄組數據,作者確定了花(FL)、愈傷組織(CA)、初級胚(PE)、子葉胚(CE)、成熟胚(ME)以及不同階段的乳膠(T1、T7、TN)中的差異表達雙等位基因。其中10,136個等位基因表現出組織特異性表達,9,546個(94.18%)呈現穩定的ASE模式。在這些一致的ASE等位基因中,4753個傾向于在hapA染色體上高表達,而4793個等位基因總是以hapB染色體為主導。僅590個基因(5.82%)表現出動態ASE模式(優勢等位基因隨樣本變化),體現了橡膠樹獨特的等位基因調控格局。 在這些組織和器官中,TN是從經過五年采伐的樹木上采集的乳膠樣本,代表了成熟橡膠樹中產生的NR(天然橡膠)。TN中共有4735個等位基因呈現出ASE模式,其中2349在hapA基因組中高度表達,而2386則在hapB中主要表達。這些基因的功能主要集中于核苷酸磷酸二酯鍵水解,可能與DNA和RNA穩定性相關。有趣的是,在與橡膠生物合成相關的82個基因中,有17個屬于MVA、MEP、起始合成以及橡膠延伸途徑的基因呈現出一致的ASE模式,這導致了同源染色體之間的表達失衡,從而可能影響橡膠的產量。
圖3 橡膠中的等位基因特異性表達(ASE)模式 四、甲羥戊酸充當了橡膠生物合成過程中的主要碳庫 連續割膠會導致橡膠產量逐漸增加,并在7至10次后達到穩定水平。為了揭示這一現象背后的機制,作者研究了T1-T10以及TN樣本。T1-T7期間干橡膠產量逐漸上升,并在之后保持穩定水平(T8-TN)。橡膠顆粒的大小(與橡膠生物合成活性呈負相關)以及乳膠中的蔗糖含量(乳膠代謝活動的負指標)逐漸降低,而橡膠合成活性逐漸提升。因此,作者提出T7是評估橡膠合成活性的關鍵時間點。 為了闡明橡膠合成活性提升的具體機制,作者對T1、T7和TN組進行了比較代謝組學和轉錄組學分析。在T1、T7和TN的樣本中,共鑒定出390種差異積累代謝物(DAMs),氨基酸及其衍生物這一類別包含的DAMs數量占主導(58種),反映乳管排膠后需快速補充細胞質成分。在前20種DAMs中,上調的代謝物主要涉及香豆素、氨基酸及其衍生物、有機酸、糖類、核苷酸衍生物、酚酸和單萜類等。甲羥戊酸(是異戊烯基焦磷酸(IPP)的前體,參與橡膠生物合成)也上調了表達。下調的代謝物主要以糖類為主,這些糖類被認為是橡膠生物合成的碳源。 橡膠生物合成是一種較長的萜類生物合成途徑,主要包括前體IPP的合成以及橡膠聚合物的形成。基于本次構建的T2T基因組,作者發現,MVA途徑基因的轉錄水平總體上高于MEP途徑基因的轉錄水平。其中甲羥戊酸激酶1(MVK1)是最顯著上調的基因,其轉錄量增加了超過10倍。此外,MVA(MVK的底物)在T7和TN中也分別增加了14倍和8倍。針對橡膠生物合成通路基因與所有代謝物的相關性分析表明,包含64種代謝物的簇與大多數橡膠生物合成基因顯著正相關。MVA作為唯一一種被鑒定為直接參與橡膠生物合成通路的DAM,與44個橡膠合成相關的基因表達存在顯著相關性,以及與MVK1的表達存在極其顯著的相關性。表明MVA及其衍生物(5-磷酸甲羥戊酸/焦磷酸甲羥戊酸)可能是乳管中橡膠生物合成的主要碳庫。
圖4 連續割膠對橡膠生物合成途徑代謝產物的影響 五、連續割膠通過JA信號通路促進橡膠的生物合成 在三次采樣之間,共鑒定出6466個差異表達基因(DEGs)。RNA生物合成過程的調節(GO:2001141)、雜環生物合成過程(GO:0018130)、大分子生物合成過程的調節(GO:0010556)以及氮化合物代謝過程(GO:0051171)相關的基因與T1、T7和TN中的膠乳產量和合成活性呈正相關。這些基因中的絕大多數編碼植物轉錄因子(TF),而MYC2被預測為是一個負責調控橡膠的生物合成過程的網絡中的核心基因。ERF1B和JAZ8是JA信號通路的轉錄因子,它們可能與MYC2共同作用,以調節采膠過程中橡膠合成活性的增加。此外,激素水平,如JA、JA-ILE和OxIAA,在連續的采膠過程中顯著升高,表明JA在調節橡膠合成活性方面起作用。為了研究JA在促進橡膠生物合成中的作用,作者對未采膠的橡膠樹在每個T1、T4和T7時間點采膠前24小時用外源JA(0.1%w/v)處理,發現在T4和T7采膠時JA處理樹的13C百分比和橡膠干產量顯著高于對照樹,表明外源JA的應用提高了橡膠的合成活性。并且qRT-PCR結果顯示,JA上調了乳膠中MVK1的表達。但在TN階段,JA處理過的橡膠樹的橡膠生物合成活性和干橡膠產量與對照組相似,差異無統計學意義。推測采膠初期的橡膠樹可能對JA更敏感。這些結果證明,連續采膠通過在乳膠中積累JA激活了橡膠生物合成。 值得注意的是,在MVK1基因的上游區域(-456bp)發現了一個與MYC響應元件相關的位置,而其同源基因MVK2并不包含此元件。LUC實驗和Y1H實驗表明MYC2能夠與MVK1啟動子上的G-box順式元件相互作用并激活MVK1的轉錄。作者最終推測了一個機制模型:連續割膠會導致內源性JA水平的增加,并且在激活的JA通路中,MYC2上調了MVK1基因的表達,從而促進橡膠的生物合成。
圖5 連續割膠過程中的代謝組和激素譜分析 本研究成功構建了首個橡膠樹CATAS 7-33-97栽培種的單倍型T2T參考基因組,完整組裝的36條染色體能夠全面鑒定橡膠生物合成基因及其等位基因特異性表達。通過整合轉錄組和代謝組數據,作者重建了橡膠生物合成途徑,并證實了甲羥戊酸(MVA)途徑是割膠期間快速乳膠再生的主要碳源。茉莉酸(JA)通過增強機械損傷響應下的生物合成活性,在促進橡膠產量方面發揮關鍵作用。最終,文章提出了一種模型,即JA誘導的MYC2激活MVK1的表達,從而促進MVA合成和橡膠生產。盡管詳細的調控途徑仍需通過實驗驗證,但這個無遺漏的參考基因組有望很快揭示細節機制,并有助于培育更高產的克隆品種。 如有相關技術需求,歡迎聯系我們~
項目咨詢
{ 往 期 精 彩 回 顧 } |










