重磅综述 | Trends in Cell Biology:聚焦转录调控热点:环状RNA的生物发生和功能

编译:艾奥里亚,编辑:十九、江舜尧。

原创微文,欢迎转发转载。

许多真核蛋白编码基因都能产生外显子环状RNA。这些共价连接的转录本大多表达量很低,但有些积累到比它们相关的线性mRNAs还要高的水平。本文重点介绍了近年来开发的用于识别和表征这些转录本的几种方法,这些方法在揭示环状RNA是如何产生并发挥作用方面,给出了越来越详细的观点。现在已经很清楚,环状RNA水平的调节可以导致多种分子和生理表型,包括对神经系统、对先天免疫、对microRNA以及对许多与疾病相关的途径造成影响。

论文ID

原名:Biogenesis and Functions of Circular RNAs Come into Focus

译名:环状RNA的生物发生和功能引起了人们的关注

期刊:Trends in Cell Biology

IF:16.588

发表时间:2020年3月

通讯作者:Jeremy E. Wilusz

通讯作者单位:宾夕法尼亚大学佩雷尔曼医学院(University of Pennsylvania Perelman School of Medicine)

DOI号:10.1016/j.tcb.2019.12.004

主要内容

1 环状RNA是由许多真核生物蛋白编码基因产生

大多数真核基因受到内含子序列的干扰,而这些内含子序列必须由剪接体从早期前体mRNA(Pre-mRNAs)中移除。长期以来,人们一直认为,大多数内含子一旦被转录,就会按照顺序且快速地被移除,从而允许每个外显子与下一个外显子共价连接,并产生一个功能性的线性mRNA(图1A,顶部)。然而,这种剪接的决定因素通常都是高度调控的,许多基因产生各种具有独特外显子组合的成熟剪接转录本。这些具有共价连接末端的环状RNA通常是由剪接供体(5′剪接位点)通过一种称为反向剪接的选择性剪接形式与上游剪接受体(3′剪接位点)连接时产生(图1A,底部)。理论上,基因的所有内部外显子(不包括第一个和最后一个)都可以进行反向剪接,但高通量RNA测序(RNA-seq)显示,细胞中只有一小部分可能发生反向剪接。人类基因组中有超过20万个外显子,因此,这些相对罕见的事件仍可导致在任何给定的细胞类型中都存在数千个甚至更多独特的环状RNA。这些环状RNA中的大多数的表达量都很低,但由于它们对核酸外切酶的降解具有天然的抵抗力,因此在某些情况下,这些环状RNA的积累超过了它们同源的线性mRNA水平。这表明一些蛋白编码基因的主要功能可能是产生环状RNA,而不是线性mRNA或其预期的蛋白产物。

该领域的关键问题是:(i)有多少环状RNAs在细胞中表达?(ii)如何在线性RNA生产和环形RNA生产之间做出选择?(iii)环状RNA是如何发挥作用的?近年来,已经开发了几种新的方法来识别和表征环状RNAs,并对上述问题给予了新的见解。本研究重点介绍了一些关于环状RNA的最新发现。有关环状RNA的生物发生是如何以组合的方式受到严格调控的,研究人员已经给出了一幅越来越详细的画面。

图1 真核生物pre-mRNAs可以被剪接形成线性或环状RNA。

2 全基因组检测环状RNA

目前最常见的方法是使用RNA-seq来检测环状RNA,然后识别跨越反向剪接连接的剪接reads。目前已经开发了几种识别这种reads的计算算法,但它们的灵敏度和精确度存在显著差异。例如,当使用五种不同的算法分析同一RNA-seq数据集时,仅有一种算法预测了其中约40%的假定环状RNA。其中一些转录本可能是逆转录酶人工产物或反式剪接RNA,因此至少应该使用两种算法来识别环状RNA,并且使用独立的方法(如Northern blotting或RT-PCR)来验证特定的转录本。更复杂的问题是,大多数反向剪接比正常剪接的效率要低得多。这意味着大多数环状RNA在低水平下表达。解决这个问题的一种方法是在RNA-seq之前使用外显子捕获探针,从而使特定的环状RNA的基因位点能够以进行更深度的测序。

然而,使用核糖核酸酶R(RNase R)验证和富集环状RNA是一种很常见的方法(图2A),核糖核酸酶R(RNase R)是一种3′-5′外切酶,可以消化许多线性RNA(图2B,红色对照组RNA-seq文库与棕色和蓝色的RNaseR处理后产生的RNA-seq文库进行对比)。由于环状RNA没有3′端,它们对RNase R的消化具有抵抗力,因此在剩余的RNA中表现出较高的丰度,进而在随后生成RNA-seq文库时更容易被检测到(图2C)。然而,有研究发现,数百个乃至更多的线性转录本不能被RNase R有效地消化,其中包括具有高度结构的3′端的线性RNA,包括组蛋白mRNA(图2D)以及许多丰富的非编码小RNA,如snRNAs、tRNAs和RNaseP(RPPH1)的RNA成分(图2E)。这种结构由于它们缺乏RNaseR初始结合所必需的至少7nt的3′单链末端而无法被消化。然而,如果在与RNaseR孵育之前,在体外用E. coli poly聚合酶(E-PAP)将3′末端的poly尾巴加到它们的末端,这些RNA就可以被消化(图2D,E)。我们最近发现,RNaseR也突然在内部G-quadruplex结构处停滞,从而只部分降解了数百个包含它们的线性mRNA(图2F)。有研究发现,G-quadruplex结构的稳定性与K+离子(存在于常用的RNaseR反应缓冲液中)的存在相关,而非具有较小离子半径的阳离子(如Li+)。事实上,在缓冲液中用Li+替代K+(图2A)足以使RNaseR通过G-quadruplex完全降解这些mRNA(图2F)。因此,为了获得更高纯度的环状RNA,作者建议首先用poly(A)聚合酶处理RNA样本,然后在RNaseR存在的情况下进行RNaseR酶切(图2A)。

图2 利用RNase R富集环状RNAs。A代表通常使用3′-5′外切酶RNase R用以消化线性RNA的同时富集环状RNA,在标准方法(左)中,总RNA在含K+的缓冲液中用RNase R处理,但无法消化所有的线性RNA,因此,我们通过改进(右),首先总RNA用E. coli poly聚合酶(E-PAP)处理,然后在含Li+的缓冲液中与RNase R共培养;B-F代表对HeLa总RNA进行指示处理,然后制备RNA-seq文库,B-F分别代表LGALS3,HIPK3,HIST2H2AB,RPPH1和PPP1R8;在PPP1R8 m RNA的3′非翻译区(UT R)中,紫色代表HIPK3环状RNA,绿色代表G-quadruplex。

3 序列特征和反式作用因子决定了环状RNA生物发生的效率

对小鼠Sry环状RNA的早期研究表明,该外显子两侧有约50 kb的近乎完全互补的内含子序列,而包含约400 nt的侧翼重复序列就足以从插入的外显子中产生这种环状RNA。现在人们认识到,大多数环状RNA的两侧类似地都有比平均长度更长的内含子,这些内含子互补重复,通常是人类细胞中的Alu元件。许多环状RNA的生物发生需要这些内含子重复之间的碱基配对(图3A),在某些情况下,30-40 nt重复足以使外显子环化。值得注意的是,一个基因中多个重复元件的存在可以产生不同的环状RNA,这些转录本可以有不同的表达水平,这取决于每对序列相互结合的效率(图3B)。事实上,研究者可以通过简单地搜索侧翼内含子中的互补序列来准确预测许多环状RNA。这表明内含子重复序列在许多环状RNA的生物发生中起着重要的作用。目前已有研究表明,从读入转录事件中产生的环状RNA,或者以与重复序列无关的方式产生的环状RNA只有在外显子跳跃发生后才会产生,并重新分配Lariat(图3C)。在其他基因,包括拟南芥SEPALLATA3基因,已经注意到外显子跳跃和环状RNA产生之间的相关性,在该基因中,环状RNA与其同源基因位点形成R环,以促进该特定外显子的进一步跳跃。

无论重复序列是否参与它们的生物发生,可能所有环状RNA的表达水平都是由RNA结合蛋白所调控的。RNA解旋酶DHX9(DExH-box helicase 9)与双链RNA结合,可以抑制许多反向剪接事件。另一方面,选择性剪接因子quaking(QKI)促进了人上皮间充质转换(EMT)过程中许多环状RNA的产生,而Drosophila muscleblind蛋白(MBl)与其自身的pre-mRNA结合促进环状RNA的产生,从而抑制了线性MBl mRNA的表达。因此,环状RNA水平似乎是以一种组合的方式被调控的,其中不同RNA结合蛋白微调反向剪接的效率。

反向剪接需要规范的5′和3′剪接位点,已发现至少99%的以注释到的人类环状RNA的侧翼有规范剪接基序AG-GT。然而,最近的工作表明,大多数环状RNA可能是在转录后产生,当核心剪接体因子耗尽或药物抑制时,环状RNA水平有所增加。剪接体是以循序渐进和动态的方式形成的,作者的团队在Drosophila中表明,单独消耗过多的剪接体成分或剪接催化步骤所需的蛋白质(例如Slu7),会导致线性mRNA水平下降,同时环状RNA表达增加。用剪接抑制剂isoginkgetin处理大鼠神经元时,观察到环状RNA表达模式的增加。因此,作者提出,当核心剪接体复合物耗尽或被抑制时,外显子定义复合物到交叉内含子复合物的重塑可能不会那么有效地发生(图3D)。

图3 环状RNA生物发生可由内含子重复序列、外显子跳跃和核心剪接体组分水平调控。A代表当两侧内含子碱基对中的反向重复序列(橙色箭头)相互颠倒时,可以诱导反向剪接,从而使中间的剪接位点接近;B代表多个内含子重复序列(标记为I、II、III和IV)通常存在于pre-mRNA中,这些序列允许产生不同的成熟RNA,这取决于哪个重复碱基对彼此重复;C代表外显子跳跃导致一个成熟的线性mRNA和一个内含子lariat,它可以被复制以产生一个稳定的环状RNA和一个双lariat结构,随后被降解;D代表在具有长内含子的pre-mRNA中,首先在外显子上组装形成外显子连接复合物。

4 大多数环状RNA一旦产生稳定的向细胞质传输

环状RNA由于具有共价封闭的结构,其可以天然地抵抗RNA核酸外切酶的消化,具有比线性RNA更长的半衰期。CDR1as/CIRS-7环状RNA含有miR-671 microRNA近乎完美的靶位点,可以被Argonaute-2(Ago2)切割以触发转录降解,但这一调控策略似乎是该基因所特有的。因此,在正常的、非应激的细胞中,环状RNA是如何降解的在很大程度上还不清楚。一些环状RNA可以通过包装成胞外小泡(如exosomes)来消除。有些时候,例如当这些转录本被m6A修饰时,RNA内切酶(除了下面讨论的RNaseL之外)可以引发特定环状RNA的降解。

一部分环状RNA保留在细胞核中,但绝大多数环状RNA积累在细胞质中。环状RNA如何从细胞核输出的机制仍不完全清楚,但现这些转录本的长度可用来决定其输出的模式(图4)。在Drosophila中,当DExH/D-box解旋酶Hel25E耗尽时,较长的环状RNA(>800 nt)聚集在细胞核中。Hel25E的两个人类同系物同样参与环状RNA定位的调控,其中长的环状RNA(>1300 nt)的输出取决于UAP56(DDX39B),而短的环状RNA(<400 nt)的输出取决于URH49(DDX39A)。在神经元中,环状RNA可以在突触中富集,这表明这些转录本可能存在定向运输机制,但细节仍不清楚。

图4 环状RNA以长度依赖的方式输出到细胞质中。

5 调节环状RNA水平的方法揭示了动物模型中的第一种表型

大多数环状RNA的分子和生理功能尚不清楚,但随着过表达和敲除特定环状RNA方法的发展,这一领域已经取得了越来越多的进展。环状RNA可以使用自剪接内含子或夹板连接的方法在体外产生,然后添加到细胞中。现在也有基于质粒和病毒的方法,使用内源剪接体机制来表达特定的环状RNA。这些技术现在已经使高通量筛选项目成为可能,包括最近的shRNA筛查,显示171个环状RNAs(占筛选的环状RNAs的11.3%),这些RNAs对人前列腺癌细胞系中的细胞增殖至关重要。值得注意的是,在>90%的情况下,发现环状RNA而非显性mRNA在筛查中是必不可少的,这表明环状RNA可以独立于其线性对应物驱动表型。

目前已经产生了第一个环状RNA基因敲除动物:CDR1as/CIRS-7基因敲除导致感觉运动门受损的小鼠,这是一种与神经精神疾病相关的表型;在小鼠中,CIA-cGAS基因敲除导致长期造血干细胞数量减少。CDR1as/CIRS-7的敲除是通过移除循环的整个外显子来完成的,从而也移除了存在于相反链上的编码蛋白质的CDR1基因。然而,在任何被检查的野生型小鼠组织中都没有检测到CDR1mRNA的表达,这表明所观察到的表型很可能是由于环状RNA的丢失所导致。

6 环状RNA的分子功能:超越简单的MicroRNA海绵模型

到目前为止,CDR1as/CIRS-7环状RNA由于含有进化上保守的miR-7结合位点,因此有关CDR1as/CIRS-7环状RNA的研究较为详细。这种环状RNA在大脑中高度表达,并定位于细胞质和神经细胞延伸中。考虑到它与miR-7的许多结合位点,长期以来一直认为CDR1as/CIRS-7隔离了这种microRNA,并阻止了它调节其目标mRNA的表达(图5A)。但最近在老鼠为模型的研究表明,敲除这种环状RNA并不会像microRNA海绵模型预测的那样导致大脑中大多数miR-7靶基因水平的下降。相反,成熟miR-7的水平略有降低,这导致一些miR-7靶基因的表达增加。因此,CDR1as/CIRS-7的主要分子功能可能是保护miR-7不被降解。基于这一过程,这种环状RNA可能确保适量的这种microRNA被传递到神经细胞延伸和突触,以控制miR-7靶基因的表达(图5A)。然而,大多数环状RNA在低水平表达,并且含有很少的微RNA结合位点,这使得它们极不可能作为microRNA海绵发挥作用,或作为竞争的内源性RNA(ceRNAs)发挥作用。

目前已有研究发现,在含有内部核糖体进入位点(IRES)的前提下,合成的环状RNA可以被翻译。在某些情况下,环状RNA中m6A的存在可能有助于招募核糖体,但这一结论受到质疑,其潜在机制仍不清楚。除了编码蛋白质之外,环状RNA还可以结合多种RNA结合蛋白,在某些情况下,还可以作为支架或改变蛋白质的活性。例如,PABN1基因的环状RNA可以隔离HuR,从而阻止它激活线性PABN1 mRNA的翻译。

图5 环状RNA可以调节MicroRNA的活性或被翻译。

7 环状RNA与免疫系统之间的新联系

最早发现的环状RNA是致病的植物类病毒,近年来发现越来越多的DNA病毒能够产生环状RNA。关于这些转录本是否真的具有免疫原性,目前存在相互矛盾的数据。Chen及其同事已经证明,将非自身环状RNA添加到哺乳动物细胞系或小鼠模型中,可以通过模式识别受体RIG-I激活有效的先天免疫反应(图6)。另一方面,Wesselhoeft和他的同事认为,即使纯环状RNA缺乏修饰的核苷酸,它们也不具有免疫原性。这些研究之间的不一致结果反映了环状RNA中的异质性(图6)。这需要通过使用相同的RNA等方法的进一步来协调这两组观察结果。

除了可能识别外来环状RNA外,免疫调节因子可以控制内源性环状RNA的水平。最近一项旨在识别人类HeLa细胞中的环状RNA生物发生因子的全基因组筛选的研究,揭示了几种双链RNA(dsrna)结合蛋白,包括NF90/NF110,它们参与了先天免疫过程。在未感染的细胞中,NF90/NF110可与新生转录本结合,并通过稳定内含子重复序列之间的碱基对相互作用来促进反剪接事件。然而,在病毒感染时,NF90/NF110重新定位于细胞质,限制了额外的环状rRNA的产生。这些转录本的稳态水平可以通过细胞质内切酶RNaseL在感染期间进一步降低。最近有人提出,环状RNA水平的快速下降可以在先天性免疫反应中发挥关键作用,因为它允许与环状RNA(例如,NF90/NF110或dsRNA依赖的激酶PKR)结合的蛋白质在识别致病RNA时被释放和激活(图6)。事实上,在感染EMCV(脑心肌炎病毒)的HeLa细胞中,环状RNA的过度表达导致PKR活性降低和病毒mRNA表达增加。因此,环状RNA可以作为一个基团来调节免疫反应。这些数据进一步表明,RNaseL可能作用于PKR的上游,但其他使用RNaseL基因敲除细胞的研究发现,在PKR激活过程中不需要RNaseL。现在需要进一步的工作来阐明环状RNA和各种模式识别受体在病毒感染模型以及自身免疫条件下的确切相互作用。

图6 环状RNA与免疫系统。

8 环状RNA在癌症中的作用

与正常细胞相比,在大多数癌症类型中,环状RNA水平普遍降低,这表明细胞增殖和这些转录物的稳定水平之间存在联系。通过降低细胞增殖的激酶抑制剂diaciclib处理LNCaP前列腺癌细胞,会导致环状RNA水平总体水平的增加,这一结果与亲本基因表达的变化无关。这表明环状RNA可能会被细胞分裂稀释。然而,环状RNA水平可以与癌症患者的临床结果相关,并且一些环状RNA在肿瘤细胞中发挥功能。Foxo3基因的环状RNA促进细胞凋亡,从而限制肿瘤生长。未来几年,这些转录本在癌症和其他疾病(如阿尔茨海默病)中的额外功能会被慢慢揭示。此外,由于环状RNA是稳定的,并且存在于体液中,因此它们在作为新的疾病生物标记物方面具有很广阔的前景。

9 总结

综上所述,最近的研究清楚地表明,环状RNA在某些情况下,可以发挥重要的生物学功能。调节许多环状RNA水平的机制已经被发现,但许多分子细节仍然知之甚少,几个关键问题仍然没有答案。只有很小一部分由RNAseq实验确定的环状RNA被研究,因此研究者对大多数环状RNA的功能知之甚少。目前仍有许多环状RNA,特别是在神经系统中,但首要确定它们对细胞的生理学是否具有重要性意义。高通量筛选和动物模型已经开始揭示当单个环状RNA的表达受到调控时的表型,但仍需要更多的研究。值得注意的是,许多单独的环状RNA的表达水平非常低,这可能会导致人们质疑它们的意义,但最近的研究表明,环状RNA可以作为一个群体而起到重要,从而即使是罕见的转录本也能对关键的生物过程做出贡献。通过对方法学的不断改进和对正常和疾病状态下的环状RNA的进一步探索,可以肯定的是,在未来的几年里,对这些转录本的更多洞察力将会被揭示出来。


更多推荐

科研 | PNAS:转录组学揭示急性和慢性饮酒对肝脏昼夜新陈代谢有不同的影响

重磅综述 | Cell:非编码RNAs在肿瘤学中的作用(IF=36.216)

(0)

相关推荐