标准化分析 > RNA测序 > lncRNA测序 > lncRNA案例1
植物中转座子促成的抗性相关的基因间区长非编码RNA(lincRNA)
Transposable elements (TEs) contribute to stress-related long intergenic noncoding RNAs in plants
The Plant Journal (2017) 90, 133–146
doi: 10.1111/tpj.13481
背景
通过高通量测序技术,非编码RNA已在植物和动物转录组中被广泛研究。这些非编码RNA中,越来越多的基因间长非编码(lincRNA)在多细胞生物中为人所知,但是大部分lincRNA的起源和功能仍有待探索。在许多真核基因组中,转座子(TE)广泛分布,通常占植物和动物基因组的大部分,但是TE对lincRNA的贡献在很大程度上是未知的。
主要材料方法
1. 材料与数据
拟南芥、水稻和玉米RNA-Seq,包括三个生物学重复(GSE76798)
2. 主要分析流程
(1)全基因组lincRNA的鉴定(具体流程见图1);
(2)lincRNA中TE的含量、种类等特征;
(3)拟南芥中TE-lincRNA的表达谱特征;
(4)转基因验证TE-lincRNA对非生物胁迫的响应;
(5)ddm1突变体植株中lincRNA的特征。
主要结果
1、三种植物物种中转座子相关lincRNA(TE-lincRNA)的全基因组鉴定
为了系统地鉴定TE-lincRNA,该课题组对三个物种的两周大幼苗进行了链特异性转录组测序。由于在人类和小鼠中早已报道反转录转座子来源的lncRNA的表达水平很低,因此该研究组在拟南芥、水稻和玉米中测定了高深度的转录组序列,分别来自每个物种的三个生物学重复,包括66、173、256百万对双端测序读序。该课题组还建立了一个鉴定TE-lincRNA的流程(图1),其中包括三个关键步骤。第一,使用TopHat2将读序比对到三个物种相应的参考基因组上,并且使用Cufflinks软件组装每个物种中的转录本。第二,保留长度大于200nt并且与已知基因没有重叠区域的转录本,此外还要删除那些可能编码多肽或者蛋白的转录本,包括与SWISSPROT数据库中序列相似的转录本,和内部开放阅读框(ORF)大于100aa或者尾部开放阅读框大于50aa的转录本。通过这步筛选,拟南芥、水稻和玉米中分别还有205、1229、773个转录本(也就是lincRNA)符合要求(表1)。第三,部分与TE位点重合但是不完全在TE位点内的lincRNA就是TE-lincRNA。最后,该课题组在拟南芥、水稻和玉米中分别鉴定到47、611和398个TE-lincRNA(表1)。水稻和玉米中的TE-lincRNA数量比拟南芥中多与各物种基因组上的TE位点数量有关(表1)。
该课题组还比较了TE-lincRNA和不含有TE的lincRNA(也就是non-TE-lincRNA)的基本特征。TE-lincRNA和non-TE-lincRNA在三个物种中的长度分布类似,TE-lincRNA的平均长度显著长于non-TE-lincRNA,在三个物种中分别是829nt对应773nt(拟南芥,P值0.01347,Wilcoxon秩和检验)、1125nt对应834nt(水稻,P值小于2.2e-16,Wilcoxon秩和检验)、1343nt对应753nt(玉米,P值小于2.2e-16,Wilcoxon秩和检验)。三个物种中的大部分lincRNA,包括TE-lincRNA和non-TE-lincRNA都只有单个外显子。拟南芥和水稻中TE-lincRNA和non-TE-lincRNA的平均外显数量没有显著差异,而玉米中TE-lincRNA的外显子数量稍显著低于non-TE-lincRNA(拟南芥1.6对1.5,P值0.2507;水稻1.6对1.7,P值0.1432;玉米1.3对1.4,P值0.007197;Wilcoxon秩和检验)。这些结果揭示TE可能导致了lincRNA转录长度的延长,但是在水稻和玉米中并不会增加剪接复杂性。此外,该课题组还通过利用Rfam数据库评估了TE-lincRNA和non-TE-lincRNA中的RNA基序的分值,发现大多数TE-lincRNA和non-TE-lincRNA都不含有或者只含有一条RNA基序,TE-lincRNA和non-TE-lincRNA的RNA基序数量之间没有显著差异。TE-lincRNA和non-TE-lincRNA在蛋白编码基因的5’或者3’端的5kb区域都显示出位置分布的偏向性。一些TE-lincRNA和non-TE-lincRNA的表达量与他们邻近的基因的表达量呈现显著正相关或者负相关。该课题组根据编码和非编码基因的表达量建立了共表达网络,其中包括含有16320个编码基因、77个lincRNA(包括12个TE-lincRNA)的21个共表达子网络。TE-lincRNA在胁迫响应子网络中与多个编码基因有很高的表达相关性。
图1 从RNA-Seq数据中鉴定转座子相关lincRNA的流程
表1 该研究鉴定的lincRNA汇总
2、TE对lincRNA的贡献的验证
植物中的TE主要分成两类:第一类通过RNA中间体进行转座(复制和粘贴机制),第二类通过DNA中间体进行转座(切断和粘贴机制)。根据序列相似性,这两类TE还可被分为很多家族,并且每一个TE家族都有它们自己的功能和进化历史。因此,该课题组研究了不同TE家族对lincRNA的贡献。在拟南芥中,超过40%的TE-lincRNA含有28个RC/Helitron TE(图2a)。在水稻中,大多数TE-lincRNA分别含有424个微型反向重复转座子(MITE)、438个未分类的转座子和335个未分类的反转录转座子。而在玉米中,对于自交系品种B73中的lincRNA,Gypsy、LTR和Copia反转录转座子是三种最主要的贡献者(图2a)。由于不同基因组中不同TE的拷贝数不同,因此该课题组采用富集分析来检验不同TE对lincRNA的贡献的显著性。结果(图2b)显示,拟南芥中的短散布元素(SINE)对lincRNA贡献最显著,水稻中贡献较多的是未分类转座子、未分类反转录转座子、Ty3-gypsy和着丝粒特异的反转录转座子,玉米中最显著贡献的是LTR和长散布元素(LINE)。这些结果表明,在不同植物物种中不同TE家族对lincRNA有不同的贡献程度。与此研究中用到的两种作物相比,拟南芥幼苗中的lincRNA更倾向于TE家族的缺失。
图2 拟南芥、水稻和玉米中lincRNA内部不同TE家族的富集情况
此外,该课题组还发现在水稻和玉米中,大部分lincRNA只含有一个TE,而有些TE-lincRNA可含有多达18甚至43个TE。含有多个TE的TE-lincRNA的长度长于那些只有一个TE的lincRNA。此外,多数lincRNA中TE的含量较高,特别是在玉米中。该课题组还分析了水稻和拟南芥中TE-lincRNA的保守性。结果(图3)显示,做保守的原件是基因,最不保守的是TE;相比于TE,TE-lincRNA更加保守;TE-lincRNA和non-TE-lincRNA的保守水平相似。这些结果与先前观点大体一致,即lncRNA中的TE在进化上受功能或结构限制。
图3 拟南芥和水稻中TE-lincRNA、non-TE-lincRNA、基因、TE和基因间区的保守性水平
3、拟南芥中TE-lincRNA的表达图谱
该课题组通过链特异性RT-PCR在拟南芥、水稻和玉米的幼苗中验证TE-lincRNA的表达。他们在拟南芥中选择了11个候选进行验证,结果显示这些候选都表达(图4a)。同样在水稻和玉米中,各选的三个候选TE-lincRNA也都被证实表达(图4bc)。为了评估TE-lincRNA在不同拟南芥组织中的表达水平,该课题组进行了数字PCR实验。结果显示,所有的TE-lincRNA在不同组织中表现出不同的表达模式。例如,lincRNA18980在根中高表达但是在花中几乎不表达;TE-lincRNA3688、TE-lincRNA11344、TE-lincRNA15772在根、花和长角果中都低表达(图5a)。此外,该课题组还使用公共RNA-Seq数据分析了205个拟南芥lincRNA在不同胁迫处理下的表达模式。与正常生长的环境相比,多数lincRNA,包括TE-lincRNA在5种不同胁迫条件下的表达模式不同(图5b)。这些结果与先前的研究结果一致,也就是lncRNA的表达呈现组织特异性和时空特性。由于先前研究表明很多lncRNA与基因表达调控相关,因此该课题组还对候选TE-lincRNA和与它们邻近的基因进行了表达相关性的研究。对于TE-lincRNA15772和TE-lincRNA19433,它们的表达与其邻近基因的表达没有相关性;然而TE-lincRNA11344的表达水平与其相邻基因DPBF2的表达负相关(图5c),这表明TE-lincRNA11344的可能功能是下调邻近基因的表达量。
图4 TE-lincRNA在三个物种中的表达验证
图5 TE-lincRNA的表达模式
4、拟南芥TE-lincRNA11195突变体诱导对脱落酸(ABA)的抗性
为了研究TE-lincRNA在胁迫条件下的功能,该课题组在多个TE-lincRNA位点插入T-DNA产生突变体,并且在标准的实验室条件下进行脱落酸处理后观察表型。结果显示,含有LTR的TE-lincRNA11195上两个独立位点的T-DNA插入表现出抗脱落酸的表型(图6)。这两个T-DNA插入的突变体(11195-1和11195-2)都导致TE-lincRNA11195无法被实验发现(图6a)。在没有外源脱落酸的情况下,11195-1和11195-2突变体的幼苗与野生型相似(图6b)。然而,添加外源脱落酸之后(20uM ABA),与野生型相比,突变体幼苗表现出显著增强的抗性(图6b),包括显著伸长的主根和不十分显著增长的地上部分鲜重(图6c)。此外,该课题组还研究了TE-lincRNA11195在种子萌发方面的作用。lincRNA11195突变体在种子萌发阶段对外源脱落酸表现出不敏感,并且在种子萌发后的幼苗发育阶段也对脱落酸不敏感。
为了研究TE-lincRNA11195在转录调节方面的作用,该课题组使用RT-PCR在野生型和ABA不敏感突变体中评估TE-lincRNA11195的表达量。野生型Col-0中ABA处理12小时后,TE-lincRNA11195的表达量显著上升。突变体幼苗中的ABA受体PYR1/PYL1/PYL4抑制了TE-lincRNA11195的转录。这些结果表明TE-lincRNA11195是相应ABA的。为了更加深入地研究TE-lincRNA11195在非生物胁迫反应方面的功能,该课题组检测了不同胁迫条件下TE-lincRNA11195的表达量。除了ABA处理,盐胁迫和低温胁迫都影响着TE-lincRNA11195的表达量,但是并没有影响临近基因的表达量。随后在种子萌发阶段和种子萌发后幼苗发育阶段进行盐处理,发现lincRNA11195突变体中种子发芽率显著高于野生型,这也说明TE-lincRNA11195与盐胁迫相关。这些结果都表明,植物中TE-lincRNA11195与非生物胁迫响应相关。
为了鉴定TE-lincRNA11195的潜在靶基因,该课题组对正常和ABA处理的野生型和lincRNA11195突变体植株进行了RNA-Seq,并且使用一般线性模型(GLM)鉴定了ABA处理下野生型和lincRNA11195突变体的差异表达基因。结果发现有8个基因在lincRNA11195突变体中显著上调,10个基因显著下调(图7a)。对100个差异表达基因进行GO富集分析,发现这些基因主要集中在“对水杨酸的刺激响应”(图7b)。这100个差异表达基因分布在基因组的全部染色体上(图7c)。为了阐明TE-lincRNA11195的具体功能,进一步的分子分析,例如发现RNA与蛋白互作关系的RIP实验,是十分需要的。
图6 拟南芥TE-lincRNA11195与脱落酸响应相关
图7 拟南芥TE-lincRNA11195突变体的基因差异表达分析
5、ddm1突变体植株中TE-lincRNA的特征
周围环境的变化可能会引起染色质变化,并且植物中已证实有些lncRNA与生物或者非生物胁迫响应相关。因此,该课题组对ddm1突变体中lincRNA的表达量和染色质状态进行了研究。染色质重塑因子DDM1的突变能够改变DNase I超敏(DH)位点的分布,这些位点与RNA聚合酶II绑定位点密切相关。该课题组对生长两周的ddm1突变体幼苗进行转录组测序。结果发现,在ddm1突变体中发现特异的转录本,并且也发现了TE-lincRNA和non-TE-lincRNA(图8a,表1)。ddm1突变体中发现的TE-lincRNA与野生型中发现的差不多,尽管如此ddm1中发现的TE-lincRNA和non-TE-lincRNA相对较多(表1)。该课题组还在ddm1中发现387个特异的lincRNA,其中192个与DH位点重合,这表明这些特异的lincRNA可能是由于染色质状态改变而产生的。随后,通过ddm1纯合植株与野生型杂交,并且通过交叉杂交F1和F2代产生的杂合子幼苗,对这些特异性lincRNA进行了遗传研究(图8b)。有趣的是,这些lincRNA可以在杂合子F1代幼苗中检测到(图8c),并且F2代中的表达与DDM1基因型无关(图8c)。此外,这些ddm1特定的lincRNA在有些ddm1纯合子中没有表达,说明lincRNA的遗传可能是不符合孟德尔遗传定律的(non-Mendelian)。
图8 ddm1突变体植株中lincRNA的特征
小结
通过使用链特异性RNA测序,该课题组在拟南芥、水稻和玉米中分析了lincRNA的表达模式,分别鉴定了47、611和398个与TE相关的lincRNA(TE-lincRNA)。与DNA转座子相比,TE-lincRNA更常来自反转录转座子。由于水稻和玉米基因组中的反转录转座子拷贝数都很多,因此TE-lincRNA的数量也很多。该课题组通过链特异性RT-PCR验证了这些TE-lincRNA的表达,并且在盐、脱落酸和低温处理后发现这些TE-lincRNA的组织特异性和应激响应。对于拟南芥TE-lincRNA11195,突变体对ABA的敏感性降低,与野生型相比,突变体具有较长的根和较高的地上部分鲜重。最后,通过改变拟南芥染色质重塑突变体ddm1中的染色质状态,特异性lincRNA,包括TE-lincRNA,能够在前述的未转录区域转录并且在后代中遗传。该课题组的研究结果不仅证明了TE相关lincRNA在植物非生物胁迫反应中起重要作用,还发现lincRNA和TE-lincRNA可能能够作为真核生物中的适应性库。
Transposable elements (TEs) contribute to stress-related long intergenic noncoding RNAs in plants
The Plant Journal (2017) 90, 133–146
doi: 10.1111/tpj.13481
背景
通过高通量测序技术,非编码RNA已在植物和动物转录组中被广泛研究。这些非编码RNA中,越来越多的基因间长非编码(lincRNA)在多细胞生物中为人所知,但是大部分lincRNA的起源和功能仍有待探索。在许多真核基因组中,转座子(TE)广泛分布,通常占植物和动物基因组的大部分,但是TE对lincRNA的贡献在很大程度上是未知的。
主要材料方法
1. 材料与数据
拟南芥、水稻和玉米RNA-Seq,包括三个生物学重复(GSE76798)
2. 主要分析流程
(1)全基因组lincRNA的鉴定(具体流程见图1);
(2)lincRNA中TE的含量、种类等特征;
(3)拟南芥中TE-lincRNA的表达谱特征;
(4)转基因验证TE-lincRNA对非生物胁迫的响应;
(5)ddm1突变体植株中lincRNA的特征。
主要结果
1、三种植物物种中转座子相关lincRNA(TE-lincRNA)的全基因组鉴定
为了系统地鉴定TE-lincRNA,该课题组对三个物种的两周大幼苗进行了链特异性转录组测序。由于在人类和小鼠中早已报道反转录转座子来源的lncRNA的表达水平很低,因此该研究组在拟南芥、水稻和玉米中测定了高深度的转录组序列,分别来自每个物种的三个生物学重复,包括66、173、256百万对双端测序读序。该课题组还建立了一个鉴定TE-lincRNA的流程(图1),其中包括三个关键步骤。第一,使用TopHat2将读序比对到三个物种相应的参考基因组上,并且使用Cufflinks软件组装每个物种中的转录本。第二,保留长度大于200nt并且与已知基因没有重叠区域的转录本,此外还要删除那些可能编码多肽或者蛋白的转录本,包括与SWISSPROT数据库中序列相似的转录本,和内部开放阅读框(ORF)大于100aa或者尾部开放阅读框大于50aa的转录本。通过这步筛选,拟南芥、水稻和玉米中分别还有205、1229、773个转录本(也就是lincRNA)符合要求(表1)。第三,部分与TE位点重合但是不完全在TE位点内的lincRNA就是TE-lincRNA。最后,该课题组在拟南芥、水稻和玉米中分别鉴定到47、611和398个TE-lincRNA(表1)。水稻和玉米中的TE-lincRNA数量比拟南芥中多与各物种基因组上的TE位点数量有关(表1)。
该课题组还比较了TE-lincRNA和不含有TE的lincRNA(也就是non-TE-lincRNA)的基本特征。TE-lincRNA和non-TE-lincRNA在三个物种中的长度分布类似,TE-lincRNA的平均长度显著长于non-TE-lincRNA,在三个物种中分别是829nt对应773nt(拟南芥,P值0.01347,Wilcoxon秩和检验)、1125nt对应834nt(水稻,P值小于2.2e-16,Wilcoxon秩和检验)、1343nt对应753nt(玉米,P值小于2.2e-16,Wilcoxon秩和检验)。三个物种中的大部分lincRNA,包括TE-lincRNA和non-TE-lincRNA都只有单个外显子。拟南芥和水稻中TE-lincRNA和non-TE-lincRNA的平均外显数量没有显著差异,而玉米中TE-lincRNA的外显子数量稍显著低于non-TE-lincRNA(拟南芥1.6对1.5,P值0.2507;水稻1.6对1.7,P值0.1432;玉米1.3对1.4,P值0.007197;Wilcoxon秩和检验)。这些结果揭示TE可能导致了lincRNA转录长度的延长,但是在水稻和玉米中并不会增加剪接复杂性。此外,该课题组还通过利用Rfam数据库评估了TE-lincRNA和non-TE-lincRNA中的RNA基序的分值,发现大多数TE-lincRNA和non-TE-lincRNA都不含有或者只含有一条RNA基序,TE-lincRNA和non-TE-lincRNA的RNA基序数量之间没有显著差异。TE-lincRNA和non-TE-lincRNA在蛋白编码基因的5’或者3’端的5kb区域都显示出位置分布的偏向性。一些TE-lincRNA和non-TE-lincRNA的表达量与他们邻近的基因的表达量呈现显著正相关或者负相关。该课题组根据编码和非编码基因的表达量建立了共表达网络,其中包括含有16320个编码基因、77个lincRNA(包括12个TE-lincRNA)的21个共表达子网络。TE-lincRNA在胁迫响应子网络中与多个编码基因有很高的表达相关性。
图1 从RNA-Seq数据中鉴定转座子相关lincRNA的流程
表1 该研究鉴定的lincRNA汇总
2、TE对lincRNA的贡献的验证
植物中的TE主要分成两类:第一类通过RNA中间体进行转座(复制和粘贴机制),第二类通过DNA中间体进行转座(切断和粘贴机制)。根据序列相似性,这两类TE还可被分为很多家族,并且每一个TE家族都有它们自己的功能和进化历史。因此,该课题组研究了不同TE家族对lincRNA的贡献。在拟南芥中,超过40%的TE-lincRNA含有28个RC/Helitron TE(图2a)。在水稻中,大多数TE-lincRNA分别含有424个微型反向重复转座子(MITE)、438个未分类的转座子和335个未分类的反转录转座子。而在玉米中,对于自交系品种B73中的lincRNA,Gypsy、LTR和Copia反转录转座子是三种最主要的贡献者(图2a)。由于不同基因组中不同TE的拷贝数不同,因此该课题组采用富集分析来检验不同TE对lincRNA的贡献的显著性。结果(图2b)显示,拟南芥中的短散布元素(SINE)对lincRNA贡献最显著,水稻中贡献较多的是未分类转座子、未分类反转录转座子、Ty3-gypsy和着丝粒特异的反转录转座子,玉米中最显著贡献的是LTR和长散布元素(LINE)。这些结果表明,在不同植物物种中不同TE家族对lincRNA有不同的贡献程度。与此研究中用到的两种作物相比,拟南芥幼苗中的lincRNA更倾向于TE家族的缺失。
图2 拟南芥、水稻和玉米中lincRNA内部不同TE家族的富集情况
此外,该课题组还发现在水稻和玉米中,大部分lincRNA只含有一个TE,而有些TE-lincRNA可含有多达18甚至43个TE。含有多个TE的TE-lincRNA的长度长于那些只有一个TE的lincRNA。此外,多数lincRNA中TE的含量较高,特别是在玉米中。该课题组还分析了水稻和拟南芥中TE-lincRNA的保守性。结果(图3)显示,做保守的原件是基因,最不保守的是TE;相比于TE,TE-lincRNA更加保守;TE-lincRNA和non-TE-lincRNA的保守水平相似。这些结果与先前观点大体一致,即lncRNA中的TE在进化上受功能或结构限制。
图3 拟南芥和水稻中TE-lincRNA、non-TE-lincRNA、基因、TE和基因间区的保守性水平
3、拟南芥中TE-lincRNA的表达图谱
该课题组通过链特异性RT-PCR在拟南芥、水稻和玉米的幼苗中验证TE-lincRNA的表达。他们在拟南芥中选择了11个候选进行验证,结果显示这些候选都表达(图4a)。同样在水稻和玉米中,各选的三个候选TE-lincRNA也都被证实表达(图4bc)。为了评估TE-lincRNA在不同拟南芥组织中的表达水平,该课题组进行了数字PCR实验。结果显示,所有的TE-lincRNA在不同组织中表现出不同的表达模式。例如,lincRNA18980在根中高表达但是在花中几乎不表达;TE-lincRNA3688、TE-lincRNA11344、TE-lincRNA15772在根、花和长角果中都低表达(图5a)。此外,该课题组还使用公共RNA-Seq数据分析了205个拟南芥lincRNA在不同胁迫处理下的表达模式。与正常生长的环境相比,多数lincRNA,包括TE-lincRNA在5种不同胁迫条件下的表达模式不同(图5b)。这些结果与先前的研究结果一致,也就是lncRNA的表达呈现组织特异性和时空特性。由于先前研究表明很多lncRNA与基因表达调控相关,因此该课题组还对候选TE-lincRNA和与它们邻近的基因进行了表达相关性的研究。对于TE-lincRNA15772和TE-lincRNA19433,它们的表达与其邻近基因的表达没有相关性;然而TE-lincRNA11344的表达水平与其相邻基因DPBF2的表达负相关(图5c),这表明TE-lincRNA11344的可能功能是下调邻近基因的表达量。
图4 TE-lincRNA在三个物种中的表达验证
图5 TE-lincRNA的表达模式
4、拟南芥TE-lincRNA11195突变体诱导对脱落酸(ABA)的抗性
为了研究TE-lincRNA在胁迫条件下的功能,该课题组在多个TE-lincRNA位点插入T-DNA产生突变体,并且在标准的实验室条件下进行脱落酸处理后观察表型。结果显示,含有LTR的TE-lincRNA11195上两个独立位点的T-DNA插入表现出抗脱落酸的表型(图6)。这两个T-DNA插入的突变体(11195-1和11195-2)都导致TE-lincRNA11195无法被实验发现(图6a)。在没有外源脱落酸的情况下,11195-1和11195-2突变体的幼苗与野生型相似(图6b)。然而,添加外源脱落酸之后(20uM ABA),与野生型相比,突变体幼苗表现出显著增强的抗性(图6b),包括显著伸长的主根和不十分显著增长的地上部分鲜重(图6c)。此外,该课题组还研究了TE-lincRNA11195在种子萌发方面的作用。lincRNA11195突变体在种子萌发阶段对外源脱落酸表现出不敏感,并且在种子萌发后的幼苗发育阶段也对脱落酸不敏感。
为了研究TE-lincRNA11195在转录调节方面的作用,该课题组使用RT-PCR在野生型和ABA不敏感突变体中评估TE-lincRNA11195的表达量。野生型Col-0中ABA处理12小时后,TE-lincRNA11195的表达量显著上升。突变体幼苗中的ABA受体PYR1/PYL1/PYL4抑制了TE-lincRNA11195的转录。这些结果表明TE-lincRNA11195是相应ABA的。为了更加深入地研究TE-lincRNA11195在非生物胁迫反应方面的功能,该课题组检测了不同胁迫条件下TE-lincRNA11195的表达量。除了ABA处理,盐胁迫和低温胁迫都影响着TE-lincRNA11195的表达量,但是并没有影响临近基因的表达量。随后在种子萌发阶段和种子萌发后幼苗发育阶段进行盐处理,发现lincRNA11195突变体中种子发芽率显著高于野生型,这也说明TE-lincRNA11195与盐胁迫相关。这些结果都表明,植物中TE-lincRNA11195与非生物胁迫响应相关。
为了鉴定TE-lincRNA11195的潜在靶基因,该课题组对正常和ABA处理的野生型和lincRNA11195突变体植株进行了RNA-Seq,并且使用一般线性模型(GLM)鉴定了ABA处理下野生型和lincRNA11195突变体的差异表达基因。结果发现有8个基因在lincRNA11195突变体中显著上调,10个基因显著下调(图7a)。对100个差异表达基因进行GO富集分析,发现这些基因主要集中在“对水杨酸的刺激响应”(图7b)。这100个差异表达基因分布在基因组的全部染色体上(图7c)。为了阐明TE-lincRNA11195的具体功能,进一步的分子分析,例如发现RNA与蛋白互作关系的RIP实验,是十分需要的。
图6 拟南芥TE-lincRNA11195与脱落酸响应相关
图7 拟南芥TE-lincRNA11195突变体的基因差异表达分析
5、ddm1突变体植株中TE-lincRNA的特征
周围环境的变化可能会引起染色质变化,并且植物中已证实有些lncRNA与生物或者非生物胁迫响应相关。因此,该课题组对ddm1突变体中lincRNA的表达量和染色质状态进行了研究。染色质重塑因子DDM1的突变能够改变DNase I超敏(DH)位点的分布,这些位点与RNA聚合酶II绑定位点密切相关。该课题组对生长两周的ddm1突变体幼苗进行转录组测序。结果发现,在ddm1突变体中发现特异的转录本,并且也发现了TE-lincRNA和non-TE-lincRNA(图8a,表1)。ddm1突变体中发现的TE-lincRNA与野生型中发现的差不多,尽管如此ddm1中发现的TE-lincRNA和non-TE-lincRNA相对较多(表1)。该课题组还在ddm1中发现387个特异的lincRNA,其中192个与DH位点重合,这表明这些特异的lincRNA可能是由于染色质状态改变而产生的。随后,通过ddm1纯合植株与野生型杂交,并且通过交叉杂交F1和F2代产生的杂合子幼苗,对这些特异性lincRNA进行了遗传研究(图8b)。有趣的是,这些lincRNA可以在杂合子F1代幼苗中检测到(图8c),并且F2代中的表达与DDM1基因型无关(图8c)。此外,这些ddm1特定的lincRNA在有些ddm1纯合子中没有表达,说明lincRNA的遗传可能是不符合孟德尔遗传定律的(non-Mendelian)。
图8 ddm1突变体植株中lincRNA的特征
小结
通过使用链特异性RNA测序,该课题组在拟南芥、水稻和玉米中分析了lincRNA的表达模式,分别鉴定了47、611和398个与TE相关的lincRNA(TE-lincRNA)。与DNA转座子相比,TE-lincRNA更常来自反转录转座子。由于水稻和玉米基因组中的反转录转座子拷贝数都很多,因此TE-lincRNA的数量也很多。该课题组通过链特异性RT-PCR验证了这些TE-lincRNA的表达,并且在盐、脱落酸和低温处理后发现这些TE-lincRNA的组织特异性和应激响应。对于拟南芥TE-lincRNA11195,突变体对ABA的敏感性降低,与野生型相比,突变体具有较长的根和较高的地上部分鲜重。最后,通过改变拟南芥染色质重塑突变体ddm1中的染色质状态,特异性lincRNA,包括TE-lincRNA,能够在前述的未转录区域转录并且在后代中遗传。该课题组的研究结果不仅证明了TE相关lincRNA在植物非生物胁迫反应中起重要作用,还发现lincRNA和TE-lincRNA可能能够作为真核生物中的适应性库。