大家好,這里是專注表觀組學十余年,領跑多組學科研服務的易基因。
植物DNA甲基化研究:
(1) NAR: 擬南芥AtHDA6與著絲粒周圍DNA甲基化關系研究
(2) nature:油棕Karma轉座子表觀遺傳重要發現
關于玉米DNA甲基化研究,華中農業大學李青團隊和美國明尼蘇達大學合作解析了玉米自然群體中的DNA甲基化變異,揭示了DNA甲基化變異的遺傳基礎以及DNA甲基化變異與基因表達和表型的關聯。該成果發表在開放獲取期刊Genome Biology上。
標題:Population-level analysis reveals the widespread occurrence and phenotypic consequence of DNA methylation variation not tagged by genetic variation in maize
期刊:Genome Biol
2021影響因子: IF 13.583
發表時間:2019.11.19
方法:液相探針捕獲甲基化測序、WGBS測序分析、GWAS分析、RNA-seq
1、研究目的
DNA甲基化是許多植物物種中研究最多的染色質修飾。 DNA甲基化在維持基因組完整性方面具有重要作用,也可能影響植物的發育和環境響應,特別是在具有復雜基因組的物種中。 DNA甲基化發生在植物的CG、CHG和CHH的三個序列環境中(H=A,C或T堿基),其中CG通過DNA甲基轉移酶1(Met1)、CHG通過染色質甲基化酶3(CMT3)、CHH通過RNA誘導的DNA甲基化(RdDM)和染色質甲基化酶2(CMT2)來維持。
近年來,高通量測序技術和基因型檢測技術的發展極大促進了作物遺傳改良,育種家可以根據大量的SNP數據建立模型,預測表型和進行基因組選擇,這一做法的前提是性狀變異由DNA序列變異(SNP)決定。但對于很多性狀,DNA序列變異通常只能解釋部分的遺傳力,仍有相當一部分遺傳力無法被解釋,許多學者將這種現象稱為“消失的遺傳力”,如何尋找并利用這部分遺傳力是遺傳學家和育種學家面臨的一個重大挑戰。研究表明,DNA甲基化在玉米不同基因型間存在巨大變異,但無法在群體水平研究DNA甲基化變異的程度及其生物學功能。
本研究對玉米不同自交系DNA甲基化中自然變異的遺傳基礎和生物學功能進行分析,揭示了存在差異甲基化區域(DMR)的許多實例證據,這些區域包含的信息不能用SNP完全捕獲。并且DNA甲基化的變化與基因表達變化有關,這種關聯依賴于序列環境以及DMR距離基因轉錄起始位點的位置。此外研究還表明,DNA甲基化變化與玉米的表型變異有關,可以解釋某些代謝性狀的部分遺傳力。
2、樣本選取
選取263份來自全球熱帶、亞熱帶和溫帶的玉米自交系,在標準溫室條件下生長至V3,隨后收集第三葉冷凍在液氮中,采用標準的CTAB法(cetyl-trimethyl-ammonium bromide)提取基因組DNA進行實驗分析。
3、實驗結果
①玉米自交系中DNA甲基化變異廣泛存在
作者使用基于探針捕獲的技術對263份來自熱帶、亞熱帶和溫帶的玉米自交系進行DNA甲基化分析,鑒定出大量DNA差異甲基化區域(Differentially methylated region, DMR),在CG,CHG,CHH上分別鑒定了8864,9759,5705個DMR。將基于捕獲技術鑒定的DMR與全基因組重亞硫酸鹽測序(WGBS)鑒定的DMR進行比較,比較結果相對應。DMR沿10條玉米染色體分布,其中許多DMRs位于基因所在區域,且這些DMRs大小非常相似,在60~1000bp之間,中位數為200bp。MEF分析(minor epiallele frequency)表明CG和CHG DMR 稀有等位基因表現出低甲基化狀態,而CHH DMR稀有等位基因通常表現出較高的甲基化水平。
雖然在不同區域確定了DMRs,但是很多位點發生了共同變化,并且在CG與CHG上有很大的冗余。作者將CG與CHG上的DMR結合并鑒定在CG_only、CHG_only和CG_CHG上的DMR,分別有708,944,2223個DMRs。
② DMRs可以區分玉米亞群
作者使用SNP和DNA甲基化水平計算個體關聯性,結果顯示CG DMRs上CG甲基化與不同自交系之間遺傳關系的關聯性顯著高于CHG DMRs上CHG甲基化和CHH DMRs上CHH甲基化,表明CG甲基化可能更穩定。使用來自DMR的CG、CHG或CHH甲基化水平進行主成分分析(Principle component analysis,PCA),結果證明了DMRs可以通過不同區域的甲基化水平將自交系分為不同的亞群,這與基于SNP的分類非常一致,其中CG甲基化區分亞群的能力最強。CG_only和CHG_only的DMRs與遺傳距離的關聯性小于CG_CHG DMR。使用DMR區分亞群表明存在亞群特異性DMRs。方差分析(an analysis of variance analysis,ANOVA)表明,在一個亞群的大多數品種中,許多DMRs表現出高甲基化或低甲基化,但沒有發現一個亞組中只有低甲基化或高甲基化的DMR。
③ 通過全基因組關聯分析來解析DMRs的遺傳基礎
DNA甲基化可能與周圍的遺傳變異有關,為了研究DMR被SNP標記的程度以及不同類型DMR之間是否存在差異,作者使用控制種群結構和個體關聯性的混合線性模型(mixed linear model)對約?100萬個高質量SNPs進行全基因組關聯分析(genome-wide association analysis,GWAS),共鑒定了4336,4096和1426個CG,CHG和CHH DMR與基因組水平顯著相關聯。在這些DMRs中,大多數僅與一個SNP顯著關聯;同樣,大多數SNP僅與一個DMR相關。且DMR和相關SNP之間的距離通常在10Mb以內?。因此,如果相關DMR在10Mb以內,則SNP被定義為局部(local)關聯SNP;?如果在不同的染色體上,則被定義為遠端(distal)關聯SNP。與玉米基因型在關聯panel中的全基因組DNA甲基化沒有明顯變化的觀察結果一致,未發現強烈的遠端熱區(distal hotspots)。表明在本研究所用的自交系中,主要甲基化機制并未受到影響。
在CG,CHG,CHH三種序列環境中,CG DMR最有可能通過局部或遠端與SNP相關聯,很少同時與兩類SNP相關聯(圖3e)。CHH DMR與SNP相關聯最少。重要的是,超過60%的DMRs與SNP沒有明顯的關聯性,這可能是因為GWAS分析通過SNP無法捕獲到DMRs中一些特異性信息。在某些情況下,DMRs可能由SNP不能有效標記的結構變異引起,這些分析表明,很大一部分DMR不能被SNP或結構變異有效捕獲。
④特異性環境DMR的染色質變異和遺傳控制
對于與SNP顯著相關聯的不同序列區域,DMR的分布存在差異。CG_only(45%)和CHG_only(26%)DMR顯著相關聯的SNP DMR比例低于CG_CHG DMR(51%)。表明CG_only和CHG_only DMR不如CG_CHG DMR穩定,這與此前研究CG_CHG DMR能更好區分玉米亞群的結果一致。在大部分CG_only DMR中,CHG在所有基因型中的水平較低,表明這些區域不是維持CHG甲基化的Zmet2/Zmet5靶點。大多數CHG_only DMR在所有基因型中具有高水平的CG甲基化,表明這些區域是維持CG甲基化酶MET1的靶點。特異性環境DMR的染色質特征也存在差異,CG_only DMR往往具有較低水平的H3K9me2和H3K27me3標記,表明CG_only DMR不太可能發生在具有抑制性染色質環境的區域中。CHG_only DMR往往具有更高的H3K9me2標記。與CG_only和CHG_only DMR相比,CG_CHG DMR具有高水平的H3K9me2和H3K27me3標記,且高的H3K9me2標記發生DNA高甲基化DMR中,而高水平的H3K27me3標記發生在DNA低甲基化DMR中,證明了此前研究DNA甲基化和H3K27me3通常表現出負相關。
⑤ DMR與基因表達的自然變異有關
為研究DNA甲基化和基因表達之間的關聯,作者以基因表達作為因變量,以DNA甲基化作為自變量進行GWAS分析。基因表達數據來自授粉后15天的籽粒,檢測到的基因表達和甲基化水平之間的顯著關聯有1389個,CG,CHG和CHH DMR分別有538,562和289個關聯。大多數顯著相關的DMR位于與基因相同的染色體上,DMR與基因之間的距離通常小于1?Mb。且大多數DMR僅與一個基因相關,這與遠端熱區的存在有關。
CG和CHG DMR與基因表達主要呈負相關,而CHH DMR與基因表達則主要呈正相關。DMR越靠近轉錄起始位點(TSS),這種關聯性趨勢就越強烈,尤其是在1?kb以內的TSS。CG和CHG DMR的負相關位于TSS下游,表明在基因組內CG和CHG甲基化可能與基因表達降低有關。此外,CG_CHG DMR與基因表達的關聯性是CG_only和CHG_only的3倍。CG_CHG DMR與CHG_only DMR的CHG甲基化與基因表達呈負相關,當CG甲基化隨CHG甲基化而變化時表現出負相關,在CG_only DMR中表現正相關。因此,基因表達與DNA甲基化之間的關聯取決于序列背景(sequence context)。
作者對DMR與不同組織(葉片和籽粒)基因表達數據進行關聯分析,分析結果表明全基因組表達水平受 DNA 甲基化變異影響,只能通過對許多不同組織或生長條件的分析來證明。且DMR無論是否被SNP標記,都可以解釋基因表達的變化。
⑥ DMRs與基因表達和表型之間的關系
差異DNA甲基化可能是差異基因表達的因或果,作者選擇了與DMR具有強關聯性但與基因表達沒有強相關的工具SNP,結果表明基因表達更可能由DMR引起。接下來,作者利用來自ddm1雙突變核組織的RNA-seq數據進行驗證,結果進一步支持了DNA甲基化可以對基因表達產生正相關或負相關的因果影響。
最后作者分析了天然DMR與表型之間的關系,作者使用了此前進行多樣性panel研究中產生的代謝數據,以DMR作為自變量,以表型數據作為因變量進行GWAS分析。在3個獨立的環境中共鑒定了986個特異性的代謝性狀,其中156個性狀(15.8%)在至少1個環境中與DMR顯著相關聯。大多數性狀(76%)與一個DMR有關。總共發現43個CG、45個CHG和63個CHH DMR與代謝性狀顯著相關聯。有趣的是,與性狀關聯的DMR中超過半數不與SNP關聯,且有些性狀只與DMR關聯而不與SNP關聯,提示DNA甲基化攜帶了特有的遺傳信息。
易基因小結
本研究對263份來自熱帶、亞熱帶和溫帶的玉米自交系的DNA甲基化進行了分析,通過群體分析鑒定出大量DNA甲基化DMR,結合高密度SNP數據、葉片和籽粒基因表達數據以及籽粒代謝數據,解析了DNA甲基化變異的遺傳基礎及其對表型變異的影響。本研究系統解析了DNA甲基化變異的遺傳基礎,并證明DNA甲基化可調控基因表達和表型,為解釋消失的遺傳力提供了新的支持。
參考資料:
1、 DOI:10.1038/s41422-020-00465-7
2、 華中農業大學官網
原文解讀: