标准化分析 > RNA测序 > lncRNA测序 > lncRNA案例2
乳腺癌lncRNA的研究揭示了DSCAM-AS1在乳腺癌发展中的作用
The lncRNA landscape of breast cancer reveals a role for DSCAM-AS1 in breast cancer progression
DOI: 10.1038/ncomms12791
背景
最近研究表明,lncRNA与多种生物过程相关,包括致癌性和肿瘤生长。为了研究乳腺癌中的lncRNA,该课题组计算了来自947个乳腺样本的RNA-seq数据中lncRNA的表达量。此前,该课题组在6,503个RNA-seq数据中大规模鉴定了约45,000个未注释的人类lncRNA,这些数据将会被用到这个研究中。基于先前在乳腺癌lncRNA方面的工作,该课题组将对乳腺癌各组织RNA-seq数据进行全面分析,并且确定能与乳腺癌有关的lncRNA。
基于指定的内分泌疗法(有效的抗雌激素),雌激素受体(ER)阳性乳腺癌患者的预后比ER阴性乳腺癌患者的预后更好。然而,尽管内分泌疗法有功效,大多数乳腺癌死亡病例发生在ER阳性乳腺癌患者身上,因为ER阳性比阴性疾病的发病率要高得多(大约80%比20%),而且有相当一部分女性患有先天或后天的内分泌治疗耐药性疾病。
综上所述,我们迫切地需要了解ER驱动的乳腺癌生物学以及它们抵抗内分泌治疗的机制。ER介导的癌症发生和进展的机制是一个激烈的科学研究领域,但现在仍不完全清楚。在这方面,虽然大量的研究集中于ER异常,如ER(ESR1) 的基因编码突变,以及可能介导耐药性的共存激活通路,如HER2,但是很少有研究对ER调控的非编码RNA进行研究。因此,该课题组开始对乳腺癌中由雌激素驱动的lncRNA进行全面的探索和研究。
主要材料方法
1. 材料与数据
947个乳腺样本的RNA-seq数据。本研究涉及到的RNA-seq数据可在NCBI的SRA数据库(SRP078392)下载, ChIP-seq数据可以在GEO数据库(GSE32222)下载。
2. 主要分析流程
(1)雌激素受体(ER)和乳腺癌相关的lncRNA的鉴定和差异表达分析(SSEA软件)。根据lncRNA的表达量进行聚类分析。依据预测的ER在lncRNA启动子区域的绑定位点,以及高表达量的条件来筛选lncRNA,最终选择DSCAM-AS1这个lncRNA来做后续的分析和研究。
(2)利用ER染色质免疫沉淀反应测序(ChIP-seq)证实ER与DSCAM-AS1的绑定关系,揭示DSCAM-AS1¬的特征。
(3)多种实验和分析(敲除和过表达实验、体外RNA结合实验、质谱、RNA免疫共沉淀、细胞侵袭实验、抗体和免疫印迹分析实验、染色质免疫沉淀实验、ChIP-seq测序分析、潜在编码蛋白分析、肿瘤临床特征相关性分析、TCGA乳腺数据生存分析、基因集合富集分析、计算机预测lncRNA上的蛋白绑定位点、RACE实验、单分子荧光原位杂交实验等)揭示DSCAM-AS1¬的功能和作用机制。
主要结果
1、雌激素受体(ER)和乳腺癌相关的lncRNA的鉴定
利用RNA-Seq非参数差异表达分析工具(Sample Set Enrichment Analysis,SSEA),研究人员关注的是那些与良性相邻组织差异表达的lncRNA。通过低表达量筛选,研究人员鉴定到437个乳腺癌中差异表达的lncRNA。根据表达量对来自不同乳腺癌亚型的lncRNA进行聚类发现,来自PAM50亚型的lncRNA与其他lncRNA表现完全不同(图1a),这可能说明了来自PAM50亚型的lncRNA有着与其他lncRNA不同的生物学作用机制。基于lncRNA表达量不能区分雌激素受体引起(ER-driven)的管腔A亚型和管腔B亚型,但是却能够很好地区分管腔型乳腺癌与HER2型、基底样型、正常乳腺样型(图1a)。除了能够区分乳腺癌的临床亚型,鉴定到的lncRNA也可以分成三个明显的簇。第一个簇(图1a‘Luminal’)中包含的lncRNA在管腔A亚型和管腔B亚型样本中过表达,但是在其他亚型或者正常样本中低表达。第二个簇(图1a‘Upregulated’)中包含的lncRNA在所有乳腺癌样本中都表达上调,并且这个簇里面包括一个已知的乳腺癌lncRNA,即HOTAIR。第三个簇(图1a‘Downregulated’)中包含的lncRNA在乳腺癌样本中下调。综上推测管腔内聚集的lncRNA可能与雌激素响应相关。
通过利用947个乳腺癌RNA-Seq样本,该课题组鉴定到了在雌激素受体阳性(ER-positive)和雌激素受体阴性(ER-negative)乳腺癌样本中差异表达的lncRNA(图1b)。正如所预期的,在雌激素受体阳性样本中差异表达的lncRNA,通过聚类能够很好地区分管腔型和HER2型、基底样型(图1b)。有趣的是,有一些在雌激素受体阳性样本中表达下调的lncRNA却能在基底样型中表达上调(图1b‘Basal lncRNAs’)。由于基底样型乳腺癌中已知的驱动基因很少,并且基底样型乳腺癌在临床上是最具有侵略性的,这些在基底样型乳腺癌中特异表达的lncRNA对以后基底样型乳腺癌的生物学研究具有重要意义。
通过筛选相对正常组织在癌症中上调的(图1a)、相对雌激素受体阴性在雌激素受体阳性样本中上调的(图1b)lncRNA,该课题组着手探究可能致癌的与雌激素受体调节相关的lncRNA。研究发现由63个lncRNA符合上述要求(图1c)。为了研究那些在生物学和临床上最有意义的lncRNA,该课题组主要关注那些在乳腺癌组织中特别高表达的、直接受雌激素受体调节的(根据ER是否绑定在目标基因的启动子区域)、在乳腺癌细胞中雌激素刺激诱导响应水平高的lncRNA(图1c)。通过这样的选择条件,该课题组选择DSCAM-AS1进行后续研究。因为DSCAM-AS1在乳腺癌组织中特别高表达、启动子区域含有ER绑定位点、在MCF7和T47D细胞系中表现出最强的雌激素诱导响应水平。
图1 雌激素受体(ER)和乳腺癌相关的lncRNA的鉴定。
2、DSCAM-AS1的特征
DSCAM-AS1最先被报道的是与一个管腔型乳腺癌细胞系的扩散相关,它在乳腺癌和肺癌中表现出高度地癌症特异性的表达模式(图2a,转录组测序数据来自TCGA和Michigan Center for Translation Pathology的6503个癌症和正常组织和细胞系)。在乳腺癌样本中,DSCAM-AS1在ER阳性肿瘤样本中表达高度富集(t检验,P值<10e-5)(图2b)。此外,对50个乳腺癌细胞系的RNA-Seq分析发现,DSCAM-AS1的表达对ER阳性细胞系有很高的特异性(图2c)。MCF7和T47D细胞系中的ER染色质免疫沉淀反应测序(ChIP-seq)发现,雌激素刺激后ER绑定到DSCAM-AS1的启动子区域(图2d),这个结果也被DSCAM-AS1的启动子区域的ChIP-qPCR实验所证实,这进一步说明了ER与DSCAM-AS1相关。在雌激素刺激后,MCF7和T47D细胞系中都诱导了DSCAM-AS1的表达,这种诱导随着三苯氧胺(tamoxifen)的加入而逆转,这证实了ER实际上调节DSCAM-AS1的表达(图2e)。已知与ER调节相关的蛋白编码基因GREB1和PGR在雌激素响应下也与DSCAM-AS1的表达模式相同,但是MALAT1(lncRNA)作为阴性对照,其表达量不能被雌激素所诱导(图2e)。
图2 DSCAM-AS1的特征。
3、DSCAM-AS1与癌症侵袭相关
该课题组随后研究了DSCAM-AS1的临床相关性。由于DSCAM-AS1是一个lncRNA,它的表达量并不是通过传统的基因芯片来计算。因此该课题组选用一种叫做guilt-by-association的分析方法,通过与DSCAM-AS1最相关的编码基因来研究其临床相关性。由于DSCAM-AS1是一个ER调节相关的lncRNA,实验仅在ER阳性乳腺癌样本中进行,因为在这些样本中DSCAM-AS1被富集并且最具有临床相关性。该课题组是用了来自Oncomine的乳腺癌临床数据集,包括与癌症、临床分级、复发、存活和转移等相关的基因表达数据集。该课题组评估了那些与DSCAM-AS1最正相关和负相关的基因。与DSCAM-AS1正相关的基因与包括癌症侵袭性增加、三苯氧胺耐药性、临床分级高、癌症转移等临床特征显著相关(图3ab)。类似地,与DSCAM-AS1负相关的基因预示着更有利的临床结果。对于大多数临床特征,DSCAM-AS1正相关的基因表现出与那些与EZH2最相关的基因类似的临床相关性,EZH2是一种已知的乳腺癌临床侵袭性相关的基因标记(图3b)。此外,对与DSCAM-AS1相关的所有基因进行基因集富集分析发现,这些基因与大量基因特征(例如乳腺癌发生、癌症侵袭性、ER和三苯氧胺相关)显著相关。虽然ER阳性乳腺癌通常导致更好的临床结果,但在管腔型乳腺癌中,DSCAM-AS1在管腔B亚型中显著高表达,而管腔B亚型乳腺癌是一种最具有临床侵袭性的ER阳性乳腺癌临床亚型(图3c)。以上这些都说明了DSCAM-AS1与临床侵袭性相关,但是在对来自TCGA的ER阳性乳腺样本的生存分析中发现,DSCAM-AS1的表达并不是与临床结果显著相关。然而,对生存的明确评估可能需要对TCGA乳腺样本进行更有力和更长期的临床治疗。
该课题组随后研究了DSCAM-AS1在ER阳性乳腺癌细胞系中的致癌作用。在MCF7和T47D细胞系中,使用shRNA方法,DSCAM-AS1能够被稳定敲除。DSCAM-AS1敲除后两种细胞系的增殖能力都降低了(图3d),侵袭能力也降低(图3e),因此这些细胞也基本上无法在软琼脂中形成菌落(图3f)。由于ER调节DSCAM-AS1的水平、ER的表达量和蛋白水平都不依赖于DSCAM-AS1的表达水平,因此排除了ER水平的改变而导致这种现象的可能性。此外,敲除DSCAM-AS1并没有影响DSCAM基因的转录和翻译水平,因为DSCAM-AS1在反义链和内含子区域。为了进一步证明DSCAM-AS1对侵袭性癌症表型的影响,该课题组在T47D和ZR75-1细胞系中过表达DSCAM-AS1,这两个细胞系是ER阳性乳腺癌细胞系,并且中度表达DSCAM-AS1(图2c)。过表达实验发现侵袭表型的增加(图3g)。没有选用MCF7细胞系来做过表达研究是因为DSCAM-AS1在该细胞系中已经有很高水平的表达量(图2c)。过表达实验也在MDA-MB-231细胞系中进行,这是一种常见的ER阴性细胞系。然而,外源DSCAM-AS1无法通过扩散和入侵致癌。这个现象可能是因为ER阳性细胞提供的必需的遗传和表观遗传环境才可以使DSCAM-AS1具有侵袭性,该作用机制的阐明需要更多研究。此外,仅仅DSCAM-AS1并不能使细胞具有高度侵袭性。为了进一步调查DSCAM-AS1对癌症表型的影响,该课题组进行了一次小鼠异种移植肿瘤生长测定,结果表明DSCAM-AS1的缺失能够减少体内植入的T47D细胞的生长(图3h)。敲除DSCAM-AS1后,植入细胞的转移潜能也降低了(图3i)。
图3 DSCAM-AS1与癌症侵袭相关。
4、hnRNPL在DSCAM-AS1机制中的作用
已有报道称lncRNA通过与RNA、DNA或者蛋白绑定而行驶功能。因此,通过鉴定DSCAM-AS1的互作蛋白可以研究该lncRNA的致癌机制。为了鉴定DSCAM-AS1的互作蛋白,该课题组进行了pull-down实验,并且对pull-down下来的产物进行质谱以确定与DSCAM-AS1绑定的蛋白(图4a)。结果显示,hnRNPL具有最高的光谱计数(图4b),并且与hnRNPL形成复合体的蛋白PCBP2也具有相当高的光谱计数。因此接下来该课题组进一步探究DSCAM-AS1与hnRNPL的互作关系。hnRNPL是一种在多个组织中表达的蛋白,并且与调节RNA稳定性和影响基因表达相关。DSCAM-AS1与hnRNPL的绑定关系不仅仅在pull-down实验中验证,也在western-blot实验中得到验证(图4c)。然而其他RNA结合蛋白并没有绑定到DSCAM-AS1上,这说明DSCAM-AS1通常不会与RNA结合蛋白混杂结合(图4c)。为了进一步证实这种绑定关系和特异性,该课题组使用针对hnRNPL的抗体进行了RNA免疫沉淀反应(RIP)。结果显示,在MCF7和T47D细胞系中抗hnRNPL免疫共沉淀反应都大量富集了DSCAM-AS1,而对照组中几乎无富集(图4d)。此外,抗snRNP70和抗HuR免疫共沉淀反应都没有pull-down下来DSCAM-AS1,这些结果说明了DSCAM-AS1与hnRNPL的绑定的特异性。
为了更具体地研究DSCAM-AS1和hnRNPL的功能,该课题组评估了敲除hnRNPL对过表达DSCAM-AS1产生的侵袭性的影响。结果显示,降低hnRNPL的水平完全逆转了过表达DSCAM-AS1产生的侵袭性(图4e)。因为在对照细胞系中敲除hnRNPL只轻微地降低了侵袭性,而在过表达DSCAM-AS1细胞系中观察到的侵袭明显减少,这可能是由于hnRNPL影响了DSCAM-AS1独有的侵袭机制。因此,为了进一步探究DSCAM-AS1和hnRNPL之间的功能关系,该课题组着手研究两者之间的绑定位点。根据之前hnRNPL交联-免疫沉淀测序(CLIP-seq)的研究,计算机预测DSCAM-AS1的绑定位点在3’端附近(图4f)。研究报道hnRNPL绑定在富含CACA碱基的RNA位点,而预测的绑定区域有10个碱基对的CACA伸展。为了证明这个预测的区域是否真的绑定hnRNPL,该课题组构建了多个包含或者不包含绑定位点的突变体。DSCAM-AS1-5和DSCAM-AS1-3是大型缺失突变体,仅含有5’端和3’端,只有DSCAM-AS1-3突变体含有预测的绑定位点,DSCAM-AS1-D突变体在预测的绑定位点有27个核苷酸的删除(图4f,g)。这些突变体在HEK293细胞系中表达,因为该细胞系缺少内源性DSCAM-AS1的表达,但是仍然表达hnRNPL。结果显示,通过pull-down实验和western-blot实验,预测的绑定位点的缺失能够有效地消除hnRNPL蛋白的绑定(图4g)。RNA二级结构是RNA功能性的重要组成部分,是RNA-蛋白质相互作用的关键因素。由于DSCAM-AS1-D突变体在预测的绑定位点的27个核苷酸的删除是转录本的很小一部分,为了证明这个小片段删除不会引起RNA二级结构的显著变化,该课题组利用RNAfold结构预测软件调查了该片段的删除对RNA二级结构的影响。根据最小自由能预测,DSCAM-AS1和DSCAM-AS1-D的假定二级结构大体相似,说明hnRNPL未能绑定到DSCAM-AS1-D突变体并不是由于二级结构的变化。有趣的是,在T47D细胞系中过表达DSCAM-AS1-D突变体未能重演过表达DSCAM-AS1时观察到的侵袭性增加(图4h)。以上这些结果都证实在这些ER阳性乳腺癌细胞中,DSCAM-AS1通过与hnRNPL的相互作用来促进致癌性。
图4 DSCAM-AS1和hnRNPL的功能关系。
5、DSCAM-AS1在三苯氧胺耐药中的作用
存在一定数量的ER阳性乳腺癌患者对内分泌治疗产生耐药性,并且在临床上表现出癌症复发和转移。因此,由于DSCAM-AS1与预后不良的ER阳性乳腺癌相关,该课题组着手研究DSCAM-AS1在推翻雌激素疗法依赖性和促进抗雌激素疗法方面的潜在功能。该课题组在1uM三苯氧胺中传代MCF7细胞6个月,直到获得能够在三苯氧胺中生长的MCF7细胞的亚群,这些细胞被称为三苯氧胺抗性MCF7细胞(TamR-MCF7)。有趣的是,虽然ER的靶标基因(GREB1和PGR)的表达量相对于亲本MCF7细胞降低,但是尽管DSCAM-AS1已经在MCF7细胞中表达水平很高,其表达量仍显著上升(图5a)。ER水平也上升,这可能更像是作为对三苯氧胺的抗雌激素作用的持续反应的一种补偿性上调。此外,三苯氧胺对亲代MCF7细胞的短时间处理,8小时后使DSCAM-AS1水平降低,24小时后恢复到处理前的水平。相比之下,ER的靶标基因GREB1在短时间和长时间处理下都表现出明显的表达减少。为了研究DSCAM-AS1在TamR-MCF7细胞中表达上调是否与其功能相关,该课题组评估了敲除DSCAM-AS1后的细胞增殖能力。在TamR-MCF7细胞中敲除DSCAM-AS1,将这些细胞在1uM三苯氧胺中培养,发现其增殖能力降低,与亲代MCF7细胞在1uM三苯氧胺中培养的增殖能力水平差不多(图5b)。此外,在这些细胞中敲除hnRNPL,与在TamR-MCF7细胞中增殖能力的缺失水平差不多,这表明DSCAM-AS1和hnRNPL可能都在促进三苯氧胺抗药性的发展方面起到作用。
该课题组还调查了在T47D细胞系中过表达DSCAM-AS1后DSCAM-AS1传递三苯氧胺抗药性的能力。过表达DSCAM-AS1¬¬与三苯氧胺抗药性的增长呈现剂量依赖性相关,在三苯氧胺含量低至100nM时,细胞活力显著增加(图5c)。此外,过表达DSCAM-AS1¬¬的细胞在雌激素缺乏的培养基中表现出增殖优势。这种增殖优势在添加雌激素后消失,并且在添加三苯氧胺后又重新获得。恰恰相反,该该课题组发现在T47D细胞中敲除DSCAM-AS1会导致雌激素依赖性增强。
为了证实这些体外实验的发现,该课题组在原发和转移的乳腺癌组织中产生了ER的ChIP-seq数据。这些肿瘤组织被分为以下几组:ER阴性原发肿瘤、ER阳性原发并且三苯氧胺响应、ER阳性原发并且三苯氧胺不响应、ER阳性转移肿瘤。引人注目的是,对DSCAM-AS1启动子的研究表明,在具有临床侵袭性的肿瘤中ER优先与DSCAM-AS1启动子结合(图5d),而ER的靶标基因GREB1几乎在所有ER阳性肿瘤中都有ER在其启动子区域绑定,并没有在在具有临床侵袭性的肿瘤中表现出倾向性。总之,这些数据表明了DSCAM-AS1的表达与具有临床侵袭性ER阳性的乳腺癌样本之间的联系,这种联系可以部分解释为,DSCAM-AS1具有促进雌激素依赖性的致癌性,从而潜在地促进了使用三苯氧胺进行内分泌治疗的耐药性。
图5 DSCAM-AS1与三苯氧胺耐药性相关。
小结
本研究中,研究人员利用了58,648个注释的长非编码RNA(lncRNA)和947个乳腺癌亚型样本,根据乳腺癌已知的分子亚型,基于lncRNA表达谱,对乳腺肿瘤进行了分类。研究人员还确定了一些乳腺癌和雌激素调节相关的lncRNA,并且具体研究了雌激素受体(ER)调节相关的lncRNA(DSCAM-AS1)的作用。他们证明了DSCAM-AS1介导的肿瘤发展和三苯氧胺(它莫西芬,一种抗雌激素)耐药性,并且鉴定了一种参与DSCAM-AS1作用机制的蛋白hnRNPL。该研究通过强调DSCAM-AS1在乳腺癌生物学和治疗耐药中的作用,提供了对乳腺癌中lncRNA的潜在的临床意义的见解。
The lncRNA landscape of breast cancer reveals a role for DSCAM-AS1 in breast cancer progression
DOI: 10.1038/ncomms12791
背景
最近研究表明,lncRNA与多种生物过程相关,包括致癌性和肿瘤生长。为了研究乳腺癌中的lncRNA,该课题组计算了来自947个乳腺样本的RNA-seq数据中lncRNA的表达量。此前,该课题组在6,503个RNA-seq数据中大规模鉴定了约45,000个未注释的人类lncRNA,这些数据将会被用到这个研究中。基于先前在乳腺癌lncRNA方面的工作,该课题组将对乳腺癌各组织RNA-seq数据进行全面分析,并且确定能与乳腺癌有关的lncRNA。
基于指定的内分泌疗法(有效的抗雌激素),雌激素受体(ER)阳性乳腺癌患者的预后比ER阴性乳腺癌患者的预后更好。然而,尽管内分泌疗法有功效,大多数乳腺癌死亡病例发生在ER阳性乳腺癌患者身上,因为ER阳性比阴性疾病的发病率要高得多(大约80%比20%),而且有相当一部分女性患有先天或后天的内分泌治疗耐药性疾病。
综上所述,我们迫切地需要了解ER驱动的乳腺癌生物学以及它们抵抗内分泌治疗的机制。ER介导的癌症发生和进展的机制是一个激烈的科学研究领域,但现在仍不完全清楚。在这方面,虽然大量的研究集中于ER异常,如ER(ESR1) 的基因编码突变,以及可能介导耐药性的共存激活通路,如HER2,但是很少有研究对ER调控的非编码RNA进行研究。因此,该课题组开始对乳腺癌中由雌激素驱动的lncRNA进行全面的探索和研究。
主要材料方法
1. 材料与数据
947个乳腺样本的RNA-seq数据。本研究涉及到的RNA-seq数据可在NCBI的SRA数据库(SRP078392)下载, ChIP-seq数据可以在GEO数据库(GSE32222)下载。
2. 主要分析流程
(1)雌激素受体(ER)和乳腺癌相关的lncRNA的鉴定和差异表达分析(SSEA软件)。根据lncRNA的表达量进行聚类分析。依据预测的ER在lncRNA启动子区域的绑定位点,以及高表达量的条件来筛选lncRNA,最终选择DSCAM-AS1这个lncRNA来做后续的分析和研究。
(2)利用ER染色质免疫沉淀反应测序(ChIP-seq)证实ER与DSCAM-AS1的绑定关系,揭示DSCAM-AS1¬的特征。
(3)多种实验和分析(敲除和过表达实验、体外RNA结合实验、质谱、RNA免疫共沉淀、细胞侵袭实验、抗体和免疫印迹分析实验、染色质免疫沉淀实验、ChIP-seq测序分析、潜在编码蛋白分析、肿瘤临床特征相关性分析、TCGA乳腺数据生存分析、基因集合富集分析、计算机预测lncRNA上的蛋白绑定位点、RACE实验、单分子荧光原位杂交实验等)揭示DSCAM-AS1¬的功能和作用机制。
主要结果
1、雌激素受体(ER)和乳腺癌相关的lncRNA的鉴定
利用RNA-Seq非参数差异表达分析工具(Sample Set Enrichment Analysis,SSEA),研究人员关注的是那些与良性相邻组织差异表达的lncRNA。通过低表达量筛选,研究人员鉴定到437个乳腺癌中差异表达的lncRNA。根据表达量对来自不同乳腺癌亚型的lncRNA进行聚类发现,来自PAM50亚型的lncRNA与其他lncRNA表现完全不同(图1a),这可能说明了来自PAM50亚型的lncRNA有着与其他lncRNA不同的生物学作用机制。基于lncRNA表达量不能区分雌激素受体引起(ER-driven)的管腔A亚型和管腔B亚型,但是却能够很好地区分管腔型乳腺癌与HER2型、基底样型、正常乳腺样型(图1a)。除了能够区分乳腺癌的临床亚型,鉴定到的lncRNA也可以分成三个明显的簇。第一个簇(图1a‘Luminal’)中包含的lncRNA在管腔A亚型和管腔B亚型样本中过表达,但是在其他亚型或者正常样本中低表达。第二个簇(图1a‘Upregulated’)中包含的lncRNA在所有乳腺癌样本中都表达上调,并且这个簇里面包括一个已知的乳腺癌lncRNA,即HOTAIR。第三个簇(图1a‘Downregulated’)中包含的lncRNA在乳腺癌样本中下调。综上推测管腔内聚集的lncRNA可能与雌激素响应相关。
通过利用947个乳腺癌RNA-Seq样本,该课题组鉴定到了在雌激素受体阳性(ER-positive)和雌激素受体阴性(ER-negative)乳腺癌样本中差异表达的lncRNA(图1b)。正如所预期的,在雌激素受体阳性样本中差异表达的lncRNA,通过聚类能够很好地区分管腔型和HER2型、基底样型(图1b)。有趣的是,有一些在雌激素受体阳性样本中表达下调的lncRNA却能在基底样型中表达上调(图1b‘Basal lncRNAs’)。由于基底样型乳腺癌中已知的驱动基因很少,并且基底样型乳腺癌在临床上是最具有侵略性的,这些在基底样型乳腺癌中特异表达的lncRNA对以后基底样型乳腺癌的生物学研究具有重要意义。
通过筛选相对正常组织在癌症中上调的(图1a)、相对雌激素受体阴性在雌激素受体阳性样本中上调的(图1b)lncRNA,该课题组着手探究可能致癌的与雌激素受体调节相关的lncRNA。研究发现由63个lncRNA符合上述要求(图1c)。为了研究那些在生物学和临床上最有意义的lncRNA,该课题组主要关注那些在乳腺癌组织中特别高表达的、直接受雌激素受体调节的(根据ER是否绑定在目标基因的启动子区域)、在乳腺癌细胞中雌激素刺激诱导响应水平高的lncRNA(图1c)。通过这样的选择条件,该课题组选择DSCAM-AS1进行后续研究。因为DSCAM-AS1在乳腺癌组织中特别高表达、启动子区域含有ER绑定位点、在MCF7和T47D细胞系中表现出最强的雌激素诱导响应水平。
图1 雌激素受体(ER)和乳腺癌相关的lncRNA的鉴定。
2、DSCAM-AS1的特征
DSCAM-AS1最先被报道的是与一个管腔型乳腺癌细胞系的扩散相关,它在乳腺癌和肺癌中表现出高度地癌症特异性的表达模式(图2a,转录组测序数据来自TCGA和Michigan Center for Translation Pathology的6503个癌症和正常组织和细胞系)。在乳腺癌样本中,DSCAM-AS1在ER阳性肿瘤样本中表达高度富集(t检验,P值<10e-5)(图2b)。此外,对50个乳腺癌细胞系的RNA-Seq分析发现,DSCAM-AS1的表达对ER阳性细胞系有很高的特异性(图2c)。MCF7和T47D细胞系中的ER染色质免疫沉淀反应测序(ChIP-seq)发现,雌激素刺激后ER绑定到DSCAM-AS1的启动子区域(图2d),这个结果也被DSCAM-AS1的启动子区域的ChIP-qPCR实验所证实,这进一步说明了ER与DSCAM-AS1相关。在雌激素刺激后,MCF7和T47D细胞系中都诱导了DSCAM-AS1的表达,这种诱导随着三苯氧胺(tamoxifen)的加入而逆转,这证实了ER实际上调节DSCAM-AS1的表达(图2e)。已知与ER调节相关的蛋白编码基因GREB1和PGR在雌激素响应下也与DSCAM-AS1的表达模式相同,但是MALAT1(lncRNA)作为阴性对照,其表达量不能被雌激素所诱导(图2e)。
图2 DSCAM-AS1的特征。
3、DSCAM-AS1与癌症侵袭相关
该课题组随后研究了DSCAM-AS1的临床相关性。由于DSCAM-AS1是一个lncRNA,它的表达量并不是通过传统的基因芯片来计算。因此该课题组选用一种叫做guilt-by-association的分析方法,通过与DSCAM-AS1最相关的编码基因来研究其临床相关性。由于DSCAM-AS1是一个ER调节相关的lncRNA,实验仅在ER阳性乳腺癌样本中进行,因为在这些样本中DSCAM-AS1被富集并且最具有临床相关性。该课题组是用了来自Oncomine的乳腺癌临床数据集,包括与癌症、临床分级、复发、存活和转移等相关的基因表达数据集。该课题组评估了那些与DSCAM-AS1最正相关和负相关的基因。与DSCAM-AS1正相关的基因与包括癌症侵袭性增加、三苯氧胺耐药性、临床分级高、癌症转移等临床特征显著相关(图3ab)。类似地,与DSCAM-AS1负相关的基因预示着更有利的临床结果。对于大多数临床特征,DSCAM-AS1正相关的基因表现出与那些与EZH2最相关的基因类似的临床相关性,EZH2是一种已知的乳腺癌临床侵袭性相关的基因标记(图3b)。此外,对与DSCAM-AS1相关的所有基因进行基因集富集分析发现,这些基因与大量基因特征(例如乳腺癌发生、癌症侵袭性、ER和三苯氧胺相关)显著相关。虽然ER阳性乳腺癌通常导致更好的临床结果,但在管腔型乳腺癌中,DSCAM-AS1在管腔B亚型中显著高表达,而管腔B亚型乳腺癌是一种最具有临床侵袭性的ER阳性乳腺癌临床亚型(图3c)。以上这些都说明了DSCAM-AS1与临床侵袭性相关,但是在对来自TCGA的ER阳性乳腺样本的生存分析中发现,DSCAM-AS1的表达并不是与临床结果显著相关。然而,对生存的明确评估可能需要对TCGA乳腺样本进行更有力和更长期的临床治疗。
该课题组随后研究了DSCAM-AS1在ER阳性乳腺癌细胞系中的致癌作用。在MCF7和T47D细胞系中,使用shRNA方法,DSCAM-AS1能够被稳定敲除。DSCAM-AS1敲除后两种细胞系的增殖能力都降低了(图3d),侵袭能力也降低(图3e),因此这些细胞也基本上无法在软琼脂中形成菌落(图3f)。由于ER调节DSCAM-AS1的水平、ER的表达量和蛋白水平都不依赖于DSCAM-AS1的表达水平,因此排除了ER水平的改变而导致这种现象的可能性。此外,敲除DSCAM-AS1并没有影响DSCAM基因的转录和翻译水平,因为DSCAM-AS1在反义链和内含子区域。为了进一步证明DSCAM-AS1对侵袭性癌症表型的影响,该课题组在T47D和ZR75-1细胞系中过表达DSCAM-AS1,这两个细胞系是ER阳性乳腺癌细胞系,并且中度表达DSCAM-AS1(图2c)。过表达实验发现侵袭表型的增加(图3g)。没有选用MCF7细胞系来做过表达研究是因为DSCAM-AS1在该细胞系中已经有很高水平的表达量(图2c)。过表达实验也在MDA-MB-231细胞系中进行,这是一种常见的ER阴性细胞系。然而,外源DSCAM-AS1无法通过扩散和入侵致癌。这个现象可能是因为ER阳性细胞提供的必需的遗传和表观遗传环境才可以使DSCAM-AS1具有侵袭性,该作用机制的阐明需要更多研究。此外,仅仅DSCAM-AS1并不能使细胞具有高度侵袭性。为了进一步调查DSCAM-AS1对癌症表型的影响,该课题组进行了一次小鼠异种移植肿瘤生长测定,结果表明DSCAM-AS1的缺失能够减少体内植入的T47D细胞的生长(图3h)。敲除DSCAM-AS1后,植入细胞的转移潜能也降低了(图3i)。
图3 DSCAM-AS1与癌症侵袭相关。
4、hnRNPL在DSCAM-AS1机制中的作用
已有报道称lncRNA通过与RNA、DNA或者蛋白绑定而行驶功能。因此,通过鉴定DSCAM-AS1的互作蛋白可以研究该lncRNA的致癌机制。为了鉴定DSCAM-AS1的互作蛋白,该课题组进行了pull-down实验,并且对pull-down下来的产物进行质谱以确定与DSCAM-AS1绑定的蛋白(图4a)。结果显示,hnRNPL具有最高的光谱计数(图4b),并且与hnRNPL形成复合体的蛋白PCBP2也具有相当高的光谱计数。因此接下来该课题组进一步探究DSCAM-AS1与hnRNPL的互作关系。hnRNPL是一种在多个组织中表达的蛋白,并且与调节RNA稳定性和影响基因表达相关。DSCAM-AS1与hnRNPL的绑定关系不仅仅在pull-down实验中验证,也在western-blot实验中得到验证(图4c)。然而其他RNA结合蛋白并没有绑定到DSCAM-AS1上,这说明DSCAM-AS1通常不会与RNA结合蛋白混杂结合(图4c)。为了进一步证实这种绑定关系和特异性,该课题组使用针对hnRNPL的抗体进行了RNA免疫沉淀反应(RIP)。结果显示,在MCF7和T47D细胞系中抗hnRNPL免疫共沉淀反应都大量富集了DSCAM-AS1,而对照组中几乎无富集(图4d)。此外,抗snRNP70和抗HuR免疫共沉淀反应都没有pull-down下来DSCAM-AS1,这些结果说明了DSCAM-AS1与hnRNPL的绑定的特异性。
为了更具体地研究DSCAM-AS1和hnRNPL的功能,该课题组评估了敲除hnRNPL对过表达DSCAM-AS1产生的侵袭性的影响。结果显示,降低hnRNPL的水平完全逆转了过表达DSCAM-AS1产生的侵袭性(图4e)。因为在对照细胞系中敲除hnRNPL只轻微地降低了侵袭性,而在过表达DSCAM-AS1细胞系中观察到的侵袭明显减少,这可能是由于hnRNPL影响了DSCAM-AS1独有的侵袭机制。因此,为了进一步探究DSCAM-AS1和hnRNPL之间的功能关系,该课题组着手研究两者之间的绑定位点。根据之前hnRNPL交联-免疫沉淀测序(CLIP-seq)的研究,计算机预测DSCAM-AS1的绑定位点在3’端附近(图4f)。研究报道hnRNPL绑定在富含CACA碱基的RNA位点,而预测的绑定区域有10个碱基对的CACA伸展。为了证明这个预测的区域是否真的绑定hnRNPL,该课题组构建了多个包含或者不包含绑定位点的突变体。DSCAM-AS1-5和DSCAM-AS1-3是大型缺失突变体,仅含有5’端和3’端,只有DSCAM-AS1-3突变体含有预测的绑定位点,DSCAM-AS1-D突变体在预测的绑定位点有27个核苷酸的删除(图4f,g)。这些突变体在HEK293细胞系中表达,因为该细胞系缺少内源性DSCAM-AS1的表达,但是仍然表达hnRNPL。结果显示,通过pull-down实验和western-blot实验,预测的绑定位点的缺失能够有效地消除hnRNPL蛋白的绑定(图4g)。RNA二级结构是RNA功能性的重要组成部分,是RNA-蛋白质相互作用的关键因素。由于DSCAM-AS1-D突变体在预测的绑定位点的27个核苷酸的删除是转录本的很小一部分,为了证明这个小片段删除不会引起RNA二级结构的显著变化,该课题组利用RNAfold结构预测软件调查了该片段的删除对RNA二级结构的影响。根据最小自由能预测,DSCAM-AS1和DSCAM-AS1-D的假定二级结构大体相似,说明hnRNPL未能绑定到DSCAM-AS1-D突变体并不是由于二级结构的变化。有趣的是,在T47D细胞系中过表达DSCAM-AS1-D突变体未能重演过表达DSCAM-AS1时观察到的侵袭性增加(图4h)。以上这些结果都证实在这些ER阳性乳腺癌细胞中,DSCAM-AS1通过与hnRNPL的相互作用来促进致癌性。
图4 DSCAM-AS1和hnRNPL的功能关系。
5、DSCAM-AS1在三苯氧胺耐药中的作用
存在一定数量的ER阳性乳腺癌患者对内分泌治疗产生耐药性,并且在临床上表现出癌症复发和转移。因此,由于DSCAM-AS1与预后不良的ER阳性乳腺癌相关,该课题组着手研究DSCAM-AS1在推翻雌激素疗法依赖性和促进抗雌激素疗法方面的潜在功能。该课题组在1uM三苯氧胺中传代MCF7细胞6个月,直到获得能够在三苯氧胺中生长的MCF7细胞的亚群,这些细胞被称为三苯氧胺抗性MCF7细胞(TamR-MCF7)。有趣的是,虽然ER的靶标基因(GREB1和PGR)的表达量相对于亲本MCF7细胞降低,但是尽管DSCAM-AS1已经在MCF7细胞中表达水平很高,其表达量仍显著上升(图5a)。ER水平也上升,这可能更像是作为对三苯氧胺的抗雌激素作用的持续反应的一种补偿性上调。此外,三苯氧胺对亲代MCF7细胞的短时间处理,8小时后使DSCAM-AS1水平降低,24小时后恢复到处理前的水平。相比之下,ER的靶标基因GREB1在短时间和长时间处理下都表现出明显的表达减少。为了研究DSCAM-AS1在TamR-MCF7细胞中表达上调是否与其功能相关,该课题组评估了敲除DSCAM-AS1后的细胞增殖能力。在TamR-MCF7细胞中敲除DSCAM-AS1,将这些细胞在1uM三苯氧胺中培养,发现其增殖能力降低,与亲代MCF7细胞在1uM三苯氧胺中培养的增殖能力水平差不多(图5b)。此外,在这些细胞中敲除hnRNPL,与在TamR-MCF7细胞中增殖能力的缺失水平差不多,这表明DSCAM-AS1和hnRNPL可能都在促进三苯氧胺抗药性的发展方面起到作用。
该课题组还调查了在T47D细胞系中过表达DSCAM-AS1后DSCAM-AS1传递三苯氧胺抗药性的能力。过表达DSCAM-AS1¬¬与三苯氧胺抗药性的增长呈现剂量依赖性相关,在三苯氧胺含量低至100nM时,细胞活力显著增加(图5c)。此外,过表达DSCAM-AS1¬¬的细胞在雌激素缺乏的培养基中表现出增殖优势。这种增殖优势在添加雌激素后消失,并且在添加三苯氧胺后又重新获得。恰恰相反,该该课题组发现在T47D细胞中敲除DSCAM-AS1会导致雌激素依赖性增强。
为了证实这些体外实验的发现,该课题组在原发和转移的乳腺癌组织中产生了ER的ChIP-seq数据。这些肿瘤组织被分为以下几组:ER阴性原发肿瘤、ER阳性原发并且三苯氧胺响应、ER阳性原发并且三苯氧胺不响应、ER阳性转移肿瘤。引人注目的是,对DSCAM-AS1启动子的研究表明,在具有临床侵袭性的肿瘤中ER优先与DSCAM-AS1启动子结合(图5d),而ER的靶标基因GREB1几乎在所有ER阳性肿瘤中都有ER在其启动子区域绑定,并没有在在具有临床侵袭性的肿瘤中表现出倾向性。总之,这些数据表明了DSCAM-AS1的表达与具有临床侵袭性ER阳性的乳腺癌样本之间的联系,这种联系可以部分解释为,DSCAM-AS1具有促进雌激素依赖性的致癌性,从而潜在地促进了使用三苯氧胺进行内分泌治疗的耐药性。
图5 DSCAM-AS1与三苯氧胺耐药性相关。
小结
本研究中,研究人员利用了58,648个注释的长非编码RNA(lncRNA)和947个乳腺癌亚型样本,根据乳腺癌已知的分子亚型,基于lncRNA表达谱,对乳腺肿瘤进行了分类。研究人员还确定了一些乳腺癌和雌激素调节相关的lncRNA,并且具体研究了雌激素受体(ER)调节相关的lncRNA(DSCAM-AS1)的作用。他们证明了DSCAM-AS1介导的肿瘤发展和三苯氧胺(它莫西芬,一种抗雌激素)耐药性,并且鉴定了一种参与DSCAM-AS1作用机制的蛋白hnRNPL。该研究通过强调DSCAM-AS1在乳腺癌生物学和治疗耐药中的作用,提供了对乳腺癌中lncRNA的潜在的临床意义的见解。