标准化分析 > DNA测序 > 表观组学 > 甲基化案例2
Critical roles of DNA demethylation in the activation of ripening-induced genes and inhibition of ripening-repressed genes in tomato fruit
PNAS 2017
doi/10.1073/pnas.1705233114
背景:
DNA甲基化(DNA methylation)是最早发现的遗传修饰途径之一。大量研究表明,DNA甲基化能引起染色质结构、DNA构象、DNA稳定性及DNA与蛋白质相互作用方式的改变,从而控制基因表达。
在植物中,DNA甲基化的碱基有两类:6-甲基腺嘌呤(6-mA)和 5-甲基胞嘧啶(5-mC),其中以胞嘧啶的甲基化为主。植物胞嘧啶甲基化主要有两个特点,一是除了会发生在CG位点之外还会发生在CHG(H代表A、C、T中的任何一种碱基)和CHH位点上。胞嘧啶的甲基化水平是由DNA甲基化和去甲基化反应共同调节的。
DNA去甲基化主要有两种类型,被动DNA去甲基化,比如既DNA复制过程中甲基化的丢失和主动去甲基化,比如甲基化主动被某些酶移除。在拟南芥中已有研究证明一些酶和主动DNA去甲基化相关联,如在DNA去甲基化通路上游发挥作用的ROS1家族基因。 由于DNA过甲基化会造成基因的表达下降,因此DNA去甲基化又被当做是抗表达沉默调节因子,或者说是对提高基因活性有帮助。
目前,主动DNA去甲基化在植物中的研究更多是在模式植物拟南芥中,而在作物中的研究仍旧缺少,例如棉花的纤维生长通路以及番茄的肉质果实的成熟通路。番茄是一种重要的经济作物同时也是研究肉质果实成熟机制的模式物种。肉质果实的成熟伴随着明显的生理生化结构变化,比如糖,香味挥发物以及色素的积累和细胞壁的水解作用,这些变化受植物激素和生长发育相关因子影响,其中乙烯最重要的几种因子之一,尤其是对于即将成熟的果实,成熟期的果实会出现乙烯含量急速增长的现象。此外,还有一些成熟相关转录因子,包括RIN, NOR, CNR等也被鉴定出。目前已有研究证明除乙烯和成熟相关转录因子之外,DNA甲基化是果实成熟的另一类关键调节因子。具体来说,番茄成熟期内经受冷害而丢失风味和 DNA甲基化相关。
基于和拟南芥DNA去甲基化基因的同源比对,番茄中共有四个可能的DNA去甲基化酶相关基因,其中SlDML1和SlDML2和拟南芥中ROS1基因几乎一致。先前的研究通过RNAi来破坏HhH-GAP功能域的方式来调查番茄中四个SlDML基因的功能,处理与否的SlDML2基因的表达量变化最大,而且处理过的植株出现了明显的晚熟表型,说明SlDMLS在水果成熟中的关键作用。但由于RNAi并未靶向某个特殊的SlDML基因,所以不清楚是哪一个SlDML基因在发挥作用,同时,果实成熟过程中主动DNA去甲基化的全基因组效应还未被确定。
主要材料方法:
1. 数据:
2. 实验材料:
所用材料为来自普渡大学西拉法叶校区温室种植的球形番茄品种Micro- Tom。
3. 主要分析流程:
原始序列的质控(q>=20)和比对通过BRAT-BW进行;
甲基化差异胞嘧啶(differentially methylated cytosines,DMC)和甲基化差异区(differentially methylated region,DMR)鉴定的步骤根据文章“Tang K, Lang Z, Zhang H, Zhu JK (2016) The DNA demethylase ROS1 targets genomicregions with distinct chromatin modifications. Nat Plants 2:16169”中的流程进行鉴定。
质控后的序列通过TopHat2比对到参考基因组,featureCount用于计算每个基因的比对序列数目,并通过edgeR计算每个基因的log2fold值;
R被用于Kmeans聚类;热图通过Matrix2png绘制。
主要结果
1. 通过CRISPR/Cas9 基因编辑系统获得稳定的SlDMLS2功能丢失突变体。
经过CRISPR/Cas9 基因编辑后并经PCR实验验证后,得到三株SlDML2基因第一个外显子缺失变异的纯和突变体,其中两株的变异完全相同,缺失变异长度为2bp,另外一株的缺失变异长度为28bp。这两类变异都被预测可以造成SlDML2第一个外显子的提前终止密码子变异。28bp缺失变异的突变体命名为sldml2-1而2bp缺失变异的突变体命名为sldml2-2。
2. sldml2 突变体的变异抑制果实成熟
从表型上(果实颜色和种子数量)两类突变体在和对照植株(WT)在46dpa(46 days after pollination, 授粉后46天 )和60dpa的果实分别比较发现,突变体的变异对果实成熟抑制明显(Fig. 1)。
Fig. 1 sldml2突变体果实成熟期表型。
3. sldml2 突变体造成全基因组DNA过甲基化
对WT和sldml2-1在25dpa和46dpa分别进行了全基因组亚硫酸盐测序(bisulfite sequencing),其中各个样本的基因组胞嘧啶超过95%均有序列覆盖,甲基化组测序覆盖平均深度超过10.7x。
为了鉴定在果实中的SlDML2基因的靶向位点,对WT-46dpa和sldml2-1-46dpa的甲基化组进行了比较分析。其中在sldml2-1-46dpa的两个重复中分别鉴定出了21515和23026个hyper-DMR(高甲基化差异区),6643和6689个hypo-DMR(低甲基化差异区)。hyper-DMR的数量远高于hypo-DMR,符合之前假设SlDML2基因的去甲基化功能的猜想。另一突变体sldml2-2也有相同结果(Fig. 2B).
Fig. 2 sldml2突变体果实成熟期全基因组DNA过甲基化分布。
在拟南芥中,去甲基化相关基因AtROS1优先靶向TE(transposable elements,转位因子)。sldml2突变体中的hypo-DMR的45%靶向为TE, 43.7%为IG(Intergenic region, 基因间区),说明SlDML2基因在番茄中优先靶向TE和IG(Fig. 3A)。同时SlDM2基因的甲基化靶向位点在染色体上的更趋向于染色体臂而非拟南芥AtROS1基因更趋向着丝粒(Fig. 3B)。
在番茄,玉米和水稻等作物中均发现基因5‘端距离500bp, 1000bp和2000bp位置有TE的比例要大于拟南芥(Fig. 3E)。说明,和拟南芥相比番茄等作物的基因更容易受临近TE的甲基化状态影响,因此DNA去甲基化在调节作物的基因表达量会比拟南芥中发挥更大的作用。
Fig. 3 sldml2突变体甲基组特性
4. 成熟诱导的DNA去甲基化过程需要SlDML2 基因的参与。
通过比较WT-25dpa和WT-46dpa的甲基化组,共鉴定出3306个hyper-DMR和13106个hypo-DMR低甲基化,其中13106个hypo-DMR在WT-60dpa时仍旧保持低甲基化状态,说明低甲基化状态在成熟的后期继续保持(Fig. 4B)。而在sldml2-1突变体中,从25dpa到46dpa,13106个 hypo-DMR的DNA甲基化水平并未降低,说明果实成熟诱导的DNA去甲基化过程需要SlDML2基因的参与(Fig. 4A),这也在在另外一个番茄品种CV的甲基化组数据中得到验证。
在将sldml2突变体中的DMR和这13106个hypo-DMR进行比较后,共发现8176个hypo-DMR和sldml2突变体的hyper-DMR重叠,和同时期的WT相比,这8176个hypo-DMR的甲基化水平明显增加,但未重叠的hypo-DMR突变体DNA甲基化水平也同样比WT高,说明这13106个hypo-DMR均是由SlDML2所控制的(Fig. 4B)。
Fig. 4 成熟诱导过程中不同样本的甲基化水平变化趋势
5. 由SlDML2调节的DNA去甲基化同样有沉默基因功能。
我们对WT-25dpa,WT-46dpa以及sldml2-1-25dpa以及sldml2-1-46dpa的两个重复进行了基因表达量测定。 在12902个hyper-DMR相关基因中,筛选出共6651个是至少有表达的基因用于接下来的分析。 通过k-means聚类的方式,将6651个基因分成三类,第一类605个基因,成熟期在WT表达量上调而突变体中下调,第二类598个基因,成熟期在WT下调而在突变体表达量上调,第三类,没有明显变化趋势。
第一类基因在sldml2和WT-46dpa的比较结果中是呈现DNA高甲基化,而表达量是下降的,这一般概念认为的DNA高甲基化和转录低效相互关联是一致的。如Fig.5B中,突变体的第一类和第二类基因在基因的上游区域均发生高甲基化现象。同时通过比较未成熟果实和成熟果实的表达量数据,发现第一类基因在果实成熟期在两个番茄品种中(Micro-Tom和AC)均是上调,同时在启动子区域同时出现DNA去甲基化现象,而在突变体中正好相反,说明SlDML2基因对于调节DNA去甲基化从而提升成熟诱导基因的转录活性是必要的,即SlDML2基因对于这类基因是有抗沉默功能的。
突变体第二类基因的表达量水平明显高于两个番茄品种,说明突变体中的二类基因的DNA高甲基化对于保持活性的二类基因很重要。在两个番茄品种的二类基因表达量受到抑制而同时又存在去甲基化现象,说明SlDML2基因对于成熟过程中表达量受到抑制的基因具有沉默的功能。
Fig. 5 SIDML2调节基因的DNA去甲基化和表达量的关联性
6. SlDML2 基因激活或抑制的基因的功能
通过GO富集结果发现,第一类基因在类黄酮生物合成和类胡萝卜素生物合成这两类中明显富集。而第二类基因在光合作用和细胞壁合成通路上是明显富集的。
许多和果实成熟相关的重要基因属于第一类基因,比如PSY1和ACS4基因,在果实成熟的WT中,被高度诱导表达,但在突变体中则相反(Fig.6A上半部)。在Fig6A下半部分中可以看到,两个基因在WT成熟期出现去甲基化现象,而突变体保持甲基化水平,说明SlDML2基因是果实成熟诱导相关通路基因的去甲基化以及表达所需要的,这其中就包括色素合成,类黄酮生物合成以及果实软化等通路。在Fig. 6B中,可以发现第二类基因的两个代表基因SlCAP10B和SlRBCS-2A呈现出了符合预期的结果,同时也采用RT-qPCR的实验手段再次验证了结果是符合的。
Fig. 6 WT以及突变体的第一类和第二类代表基因的甲基化水平和表达水平变化
总结
该研究中,通过CRISPR/Cas9基因编辑系统产生了两个番茄SlDML2功能确实的突变体,证实了SlDML2基因在番茄果实成熟过程中通过调节DNA甲基化位点来影响番茄果实成熟,其中鉴定出了全基因共29764个S1DML2调节的DMR,这些DMR优先分布在染色体臂,并优先靶向TE和IG。通过结合转录组数据分析,发现SlDML2基因调节的DNA去甲基化对于数以百计的果实成熟相关基因的启动是必须的,包括RIN以及乙烯,色素合成以及细胞壁水解作用相关基因。同时出乎意料的是,也揭示了SlDML2基因调节的DNA去甲基化对于数以百计的果实成熟抑制基因也是必须的,这些抑制基因参与到了光合作用,细胞壁合成等通路,同时这类基因的受到抑制和启动子区域DNA低甲基化水平相关联。
PNAS 2017
doi/10.1073/pnas.1705233114
背景:
DNA甲基化(DNA methylation)是最早发现的遗传修饰途径之一。大量研究表明,DNA甲基化能引起染色质结构、DNA构象、DNA稳定性及DNA与蛋白质相互作用方式的改变,从而控制基因表达。
在植物中,DNA甲基化的碱基有两类:6-甲基腺嘌呤(6-mA)和 5-甲基胞嘧啶(5-mC),其中以胞嘧啶的甲基化为主。植物胞嘧啶甲基化主要有两个特点,一是除了会发生在CG位点之外还会发生在CHG(H代表A、C、T中的任何一种碱基)和CHH位点上。胞嘧啶的甲基化水平是由DNA甲基化和去甲基化反应共同调节的。
DNA去甲基化主要有两种类型,被动DNA去甲基化,比如既DNA复制过程中甲基化的丢失和主动去甲基化,比如甲基化主动被某些酶移除。在拟南芥中已有研究证明一些酶和主动DNA去甲基化相关联,如在DNA去甲基化通路上游发挥作用的ROS1家族基因。 由于DNA过甲基化会造成基因的表达下降,因此DNA去甲基化又被当做是抗表达沉默调节因子,或者说是对提高基因活性有帮助。
目前,主动DNA去甲基化在植物中的研究更多是在模式植物拟南芥中,而在作物中的研究仍旧缺少,例如棉花的纤维生长通路以及番茄的肉质果实的成熟通路。番茄是一种重要的经济作物同时也是研究肉质果实成熟机制的模式物种。肉质果实的成熟伴随着明显的生理生化结构变化,比如糖,香味挥发物以及色素的积累和细胞壁的水解作用,这些变化受植物激素和生长发育相关因子影响,其中乙烯最重要的几种因子之一,尤其是对于即将成熟的果实,成熟期的果实会出现乙烯含量急速增长的现象。此外,还有一些成熟相关转录因子,包括RIN, NOR, CNR等也被鉴定出。目前已有研究证明除乙烯和成熟相关转录因子之外,DNA甲基化是果实成熟的另一类关键调节因子。具体来说,番茄成熟期内经受冷害而丢失风味和 DNA甲基化相关。
基于和拟南芥DNA去甲基化基因的同源比对,番茄中共有四个可能的DNA去甲基化酶相关基因,其中SlDML1和SlDML2和拟南芥中ROS1基因几乎一致。先前的研究通过RNAi来破坏HhH-GAP功能域的方式来调查番茄中四个SlDML基因的功能,处理与否的SlDML2基因的表达量变化最大,而且处理过的植株出现了明显的晚熟表型,说明SlDMLS在水果成熟中的关键作用。但由于RNAi并未靶向某个特殊的SlDML基因,所以不清楚是哪一个SlDML基因在发挥作用,同时,果实成熟过程中主动DNA去甲基化的全基因组效应还未被确定。
主要材料方法:
1. 数据:
- 文章所测的甲基化和转录组数据已经上传到NCBI GEO,数据编号为GSE94903。
- 参考基因组:
- 文章中用到的其他数据来自Zhong S, et al. (2013) Single-base resolution methylomes of tomato fruit development reveal epigenome modifications associated with ripening. Nat Biotechnol 31: 154–159
2. 实验材料:
所用材料为来自普渡大学西拉法叶校区温室种植的球形番茄品种Micro- Tom。
3. 主要分析流程:
- 甲基化测序和分析:
原始序列的质控(q>=20)和比对通过BRAT-BW进行;
甲基化差异胞嘧啶(differentially methylated cytosines,DMC)和甲基化差异区(differentially methylated region,DMR)鉴定的步骤根据文章“Tang K, Lang Z, Zhang H, Zhu JK (2016) The DNA demethylase ROS1 targets genomicregions with distinct chromatin modifications. Nat Plants 2:16169”中的流程进行鉴定。
- 转录组分析
质控后的序列通过TopHat2比对到参考基因组,featureCount用于计算每个基因的比对序列数目,并通过edgeR计算每个基因的log2fold值;
R被用于Kmeans聚类;热图通过Matrix2png绘制。
主要结果
1. 通过CRISPR/Cas9 基因编辑系统获得稳定的SlDMLS2功能丢失突变体。
经过CRISPR/Cas9 基因编辑后并经PCR实验验证后,得到三株SlDML2基因第一个外显子缺失变异的纯和突变体,其中两株的变异完全相同,缺失变异长度为2bp,另外一株的缺失变异长度为28bp。这两类变异都被预测可以造成SlDML2第一个外显子的提前终止密码子变异。28bp缺失变异的突变体命名为sldml2-1而2bp缺失变异的突变体命名为sldml2-2。
2. sldml2 突变体的变异抑制果实成熟
从表型上(果实颜色和种子数量)两类突变体在和对照植株(WT)在46dpa(46 days after pollination, 授粉后46天 )和60dpa的果实分别比较发现,突变体的变异对果实成熟抑制明显(Fig. 1)。
Fig. 1 sldml2突变体果实成熟期表型。
3. sldml2 突变体造成全基因组DNA过甲基化
对WT和sldml2-1在25dpa和46dpa分别进行了全基因组亚硫酸盐测序(bisulfite sequencing),其中各个样本的基因组胞嘧啶超过95%均有序列覆盖,甲基化组测序覆盖平均深度超过10.7x。
为了鉴定在果实中的SlDML2基因的靶向位点,对WT-46dpa和sldml2-1-46dpa的甲基化组进行了比较分析。其中在sldml2-1-46dpa的两个重复中分别鉴定出了21515和23026个hyper-DMR(高甲基化差异区),6643和6689个hypo-DMR(低甲基化差异区)。hyper-DMR的数量远高于hypo-DMR,符合之前假设SlDML2基因的去甲基化功能的猜想。另一突变体sldml2-2也有相同结果(Fig. 2B).
Fig. 2 sldml2突变体果实成熟期全基因组DNA过甲基化分布。
在拟南芥中,去甲基化相关基因AtROS1优先靶向TE(transposable elements,转位因子)。sldml2突变体中的hypo-DMR的45%靶向为TE, 43.7%为IG(Intergenic region, 基因间区),说明SlDML2基因在番茄中优先靶向TE和IG(Fig. 3A)。同时SlDM2基因的甲基化靶向位点在染色体上的更趋向于染色体臂而非拟南芥AtROS1基因更趋向着丝粒(Fig. 3B)。
在番茄,玉米和水稻等作物中均发现基因5‘端距离500bp, 1000bp和2000bp位置有TE的比例要大于拟南芥(Fig. 3E)。说明,和拟南芥相比番茄等作物的基因更容易受临近TE的甲基化状态影响,因此DNA去甲基化在调节作物的基因表达量会比拟南芥中发挥更大的作用。
Fig. 3 sldml2突变体甲基组特性
4. 成熟诱导的DNA去甲基化过程需要SlDML2 基因的参与。
通过比较WT-25dpa和WT-46dpa的甲基化组,共鉴定出3306个hyper-DMR和13106个hypo-DMR低甲基化,其中13106个hypo-DMR在WT-60dpa时仍旧保持低甲基化状态,说明低甲基化状态在成熟的后期继续保持(Fig. 4B)。而在sldml2-1突变体中,从25dpa到46dpa,13106个 hypo-DMR的DNA甲基化水平并未降低,说明果实成熟诱导的DNA去甲基化过程需要SlDML2基因的参与(Fig. 4A),这也在在另外一个番茄品种CV的甲基化组数据中得到验证。
在将sldml2突变体中的DMR和这13106个hypo-DMR进行比较后,共发现8176个hypo-DMR和sldml2突变体的hyper-DMR重叠,和同时期的WT相比,这8176个hypo-DMR的甲基化水平明显增加,但未重叠的hypo-DMR突变体DNA甲基化水平也同样比WT高,说明这13106个hypo-DMR均是由SlDML2所控制的(Fig. 4B)。
Fig. 4 成熟诱导过程中不同样本的甲基化水平变化趋势
5. 由SlDML2调节的DNA去甲基化同样有沉默基因功能。
我们对WT-25dpa,WT-46dpa以及sldml2-1-25dpa以及sldml2-1-46dpa的两个重复进行了基因表达量测定。 在12902个hyper-DMR相关基因中,筛选出共6651个是至少有表达的基因用于接下来的分析。 通过k-means聚类的方式,将6651个基因分成三类,第一类605个基因,成熟期在WT表达量上调而突变体中下调,第二类598个基因,成熟期在WT下调而在突变体表达量上调,第三类,没有明显变化趋势。
第一类基因在sldml2和WT-46dpa的比较结果中是呈现DNA高甲基化,而表达量是下降的,这一般概念认为的DNA高甲基化和转录低效相互关联是一致的。如Fig.5B中,突变体的第一类和第二类基因在基因的上游区域均发生高甲基化现象。同时通过比较未成熟果实和成熟果实的表达量数据,发现第一类基因在果实成熟期在两个番茄品种中(Micro-Tom和AC)均是上调,同时在启动子区域同时出现DNA去甲基化现象,而在突变体中正好相反,说明SlDML2基因对于调节DNA去甲基化从而提升成熟诱导基因的转录活性是必要的,即SlDML2基因对于这类基因是有抗沉默功能的。
突变体第二类基因的表达量水平明显高于两个番茄品种,说明突变体中的二类基因的DNA高甲基化对于保持活性的二类基因很重要。在两个番茄品种的二类基因表达量受到抑制而同时又存在去甲基化现象,说明SlDML2基因对于成熟过程中表达量受到抑制的基因具有沉默的功能。
Fig. 5 SIDML2调节基因的DNA去甲基化和表达量的关联性
6. SlDML2 基因激活或抑制的基因的功能
通过GO富集结果发现,第一类基因在类黄酮生物合成和类胡萝卜素生物合成这两类中明显富集。而第二类基因在光合作用和细胞壁合成通路上是明显富集的。
许多和果实成熟相关的重要基因属于第一类基因,比如PSY1和ACS4基因,在果实成熟的WT中,被高度诱导表达,但在突变体中则相反(Fig.6A上半部)。在Fig6A下半部分中可以看到,两个基因在WT成熟期出现去甲基化现象,而突变体保持甲基化水平,说明SlDML2基因是果实成熟诱导相关通路基因的去甲基化以及表达所需要的,这其中就包括色素合成,类黄酮生物合成以及果实软化等通路。在Fig. 6B中,可以发现第二类基因的两个代表基因SlCAP10B和SlRBCS-2A呈现出了符合预期的结果,同时也采用RT-qPCR的实验手段再次验证了结果是符合的。
Fig. 6 WT以及突变体的第一类和第二类代表基因的甲基化水平和表达水平变化
总结
该研究中,通过CRISPR/Cas9基因编辑系统产生了两个番茄SlDML2功能确实的突变体,证实了SlDML2基因在番茄果实成熟过程中通过调节DNA甲基化位点来影响番茄果实成熟,其中鉴定出了全基因共29764个S1DML2调节的DMR,这些DMR优先分布在染色体臂,并优先靶向TE和IG。通过结合转录组数据分析,发现SlDML2基因调节的DNA去甲基化对于数以百计的果实成熟相关基因的启动是必须的,包括RIN以及乙烯,色素合成以及细胞壁水解作用相关基因。同时出乎意料的是,也揭示了SlDML2基因调节的DNA去甲基化对于数以百计的果实成熟抑制基因也是必须的,这些抑制基因参与到了光合作用,细胞壁合成等通路,同时这类基因的受到抑制和启动子区域DNA低甲基化水平相关联。