综述 | Trends Plant Sci.:植物可变剪切与蛋白质组复杂性研究进展
编译:Young,编辑:Emma、江舜尧。
原创微文,欢迎转发转载。
可变剪接是指一个mRNA前体通过不同的剪接方式产生不同的mRNA剪接异构体。然而,在植物中蛋白质组复杂性的贡献仍然是难以捉摸的。植物在面对逆境条件下,特别是在能量供应下降的情况下,为什么植物会提供更多的能量用于蛋白质合成,这是违反常识的。笔者推断植物不仅可以利用AS潜在地增加蛋白质组的复杂性,而且可以应对胁迫带来的转录变化,以降低将所有AS转录本代谢所造成的成本。为了使胁迫下的效率最大化,植物可以通过AS使底物特异性多样化并保持足够的调节能力,从而减少蛋白质结构域的无序化。此外,笔者认为染色质状态依赖性AS能产生短期/长期应激记忆,从而在未来介导可重复的转录反应。
论文ID
实验结果
1. 蛋白质组复杂性的可变剪接调控
植物在正常和胁迫条件下严格控制其基因表达模式,以最大限度地提高碳固定和资源配置效率,促进植物生长和适应能力的短期和长期发展。可变剪接(AS)增加了另一层复杂性,以组织和条件依赖的方式调节转录组多样性和潜在的蛋白质组复杂性。众所周知,AS可以微调基因表达,然而,关于AS对植物蛋白质多样性的作用的论文较少。最近来自人类的转录组和翻译组数据表明AS对蛋白质多样性有重要贡献。然而,在编码不同蛋白质的各种蛋白质组学研究中发现的替代异构体相对较少。科学界在这个问题上存在分歧,一些人认为质谱(MS)技术的低灵敏度是检测AS引起的蛋白质异构体变化的主要限制。然而,也有人认为并非所有的蛋白亚型都具有生物学意义,因为替代转录物通常是最近的进化而来的,往往不被翻译。由于植物中可获得的蛋白质组学数据有限,因此在不同的组织中进行全面的蛋白质组学研究并对不同的胁迫作出反应,以阐明AS对植物蛋白质多样性和/或提高调节能力的贡献是至关重要的。此外,可变剪切翻译模式的整体分析需要在不同的组织和不同时间点进行研究。
转录和翻译所消耗植物的ATP是很多的,然而植物在压力条件下表现出更高的AS水平。这种情况会带来潜在的问题,例如,如果目标是使蛋白质组多样化,那么为什么当光合能力在胁迫条件下下降时,为什么植物要花费ATP于翻译?此外,AS经常生成含有过早终止密码子(PTC+)的转录物,这些密码子被无义介导的衰变(NMD)途径降解。NMD是一种细胞质mRNA质量控制机制,其靶向新合成的具有NMD+特征的转录物。有趣的是,来自人类的证据表明,NMD不仅局限于第一轮的翻译,而且由于细胞环境和/或需求的变化,NMD也可能被触发,因为已经翻译了mRNAs。在所有AS事件中,内含子保留(IR)是植物中最普遍的事件,大多数IR转录本在特定的应激或发育阶段主要被隔离在细胞核中,以便根据细胞需要进行进一步的处理,或者通过NMD途径降解。可变剪接现象(exitrons:蛋白编码外显子中包含的GT-AG内含子),称为exitrons,这些exitrons的剪接影响蛋白质功能。Exitrons和其他类型的剪接变体通常会导致内在无序蛋白质(IDP)或本质无序区域(IDRs)的形成。IDPs和IDRs由于其氨基酸组成而缺乏固定的三维结构,这阻碍了适当疏水区域的形成。重要的是,由于AS和翻译后修饰(PTMs),蛋白质三维结构的变化导致底物特异性的多样化和增强的调节能力。
与NMD偶联的AS在调节拟南芥转录组和潜在的蛋白质水平方面起主要作用。然而,大多数PTC+转录物如果翻译,会产生变短的蛋白质(图1),并产生有毒的环境来影响细胞的正常活动。NMD在第一轮翻译期间和之后的效率很高,大多数PTC+转录本在到达细胞质后迅速降解。有趣的是,在胁迫条件下,哺乳动物和植物的NMD反应都受到抑制,这种策略可能通过翻译一些应激反应基因和剪接变体来促进胁迫应对能力。笔者提出,在最初的胁迫条件下,植物通过AS来缓冲正常蛋白质合成水平,从而减少转录组的翻译,产生适应胁迫所需的蛋白质异构体。这一策略可以使植物降低代谢成本,但也可以通过AS在胁迫响应蛋白中加入替代和无序结构域来维持足够的调控能力。这种过程的细节目前还没有在任何有机体中得到,支持证据刚刚从酵母中出现。两项以酵母为模型的独立研究表明,内含子通过抑制核糖体蛋白基因来调节应激条件下的适应度。此外,AS不仅可以使植物基因在初始胁迫期间的调控能力多样化,而且还可以介导给定代谢状态和蛋白质多样性/丰度之间的串联,以应对长期的胁迫条件。植物中的表观遗传修饰,如DNA甲基化和组蛋白修饰,定义了一种表观遗传密码,该编码将环境胁迫转化为影响细胞信号网络的表观遗传足迹,并且在同一代或后代中,在反复出现的胁迫下也可以重新生成。通过这种方式,AS也可能参与由表观遗传密码介导的胁迫记忆,并且只有在经历了多次类似的胁迫之后,植物才能利用AS来产生更多的蛋白质多样性或长期保持调控控制。
图1 植物在正常和胁迫条件下可变剪接转录本命运的假设示意图
可变剪接在正常(N1–N4)和胁迫(S1–S5)条件下产生多个转录本。组成性剪接转录本(N1和S1)和选择性剪接PTC转录本(N3和S2)被翻译成功能性蛋白亚型(FPs)和本质紊乱蛋白(IDPs)。或者剪接的PTC+转录物(N2、N4、S3和S4)要么通过无义介导的衰变(NMD)途径(N4和S4)降解,要么逃逸NMD(S3)生成截短蛋白(TPs)。虽然在两种情况下都存在,但FPs在正常条件下更为丰富,而TPs和idps则构成了大部分应激诱导的蛋白质组。
2. 植物的转录和剪接动力学
转录是调节基因表达模式以响应不同发育和环境线索的基本过程。令人惊讶的是,关于植物转录机制的信息有限。人类启动子富含GC,而植物启动子富含AT,倾向于抑制核小体的形成,促进DNA的折叠和转录因子的招募。比较拟南芥的RNA-seq和GRO-seq数据库发现,新生和稳态状态转录物之间存在高度相关性。此外,稳态的转录物与生物功能如翻译、光合作用和代谢功能有关。然而,易变转录物具有更高的刺激反应基因、信号转导和激素。这些结果表明,与细胞代谢调节功能相关的保守基因比高度调控的转录本更稳定。鉴于这些发现,笔者有理由推测,由于其动态性,AS转录本将更适合于监管角色。先前的GRO-seq数据显示,植物启动子缺乏RNA聚合酶II(RNAPII)的启动子近端暂停和差异转录,这在人类以及酵母和果蝇中普遍存在。然而,最近来自拟南芥的GRO-seq和植物自然延伸转录测序(pNET-seq)实验表明,带有未磷酸化羧基末端结构域(CTD)的RNAPII确实在转录起始位点(TSS)下游聚集。然而,与哺乳动物相比,拟南芥启动子近端暂停要宽松得多,在哺乳动物中,启动子近端暂停发生在25–50nt的窄窗口中。这些发现表明,有效的RNAPII募集以及启动子近端暂停释放是拟南芥有效转录反应的必要条件。有趣的是,植物启动子也在30多聚腺苷酸化位点(PAS)附近显示Ser2P-CTD-RNAPII的积累,这表明在转录终止前存在一种监测机制。在酵母中的体外研究表明,在PAS后暂停RNAPII可能会增加监测时间并有助于mRNA降解。此外,与内含子相比,Ser5P-CTD-RNAPII在外显子中拉长得更慢,为拟南芥剪接体恰当选择剪接位点提供了更多的时间。这些数据表明,RNAPII-CTD磷酸化是一个动态过程,对植物等固着生物在不同条件下保持适当的转录和剪接动态可能更为重要。由于AS在很大程度上是共转录的,植物转录的独特特征可能与转录、剪接和处理动力学有关。
与人类相比,植物启动子具有开放的染色质结构;然而,两种植物的DNA甲基化和核小体占有率之间的关系非常相似剪接过程和剪接因子可能影响转录过程。例如,最近来自拟南芥的证据表明,温度依赖性AS与染色质水平的变化相关,以调节开花时间。Pajoro等人研究表明,H3赖氨酸36三甲基化(H3K36me3)强烈地标记了从16℃升高温度到25℃后经历AS的基因的变化。此外,H3K36me3在高温下对开花时间基因开花位点(FLM)的AS调控起着关键作用。与此数据一致,组蛋白去甲基化酶JUMONJIC结构域包含蛋白30(JMJ30)及其同系物JMJ32去除了开花位点C(FLC)的抑制性H3K27me3标记,以防止高温下的早熟开花。此外,动态染色质在可变的环境和压力条件下有也被提议在短期和长期内产生适当的转录和剪接反应。由于植物自我不断地监测它们的生理和新陈代谢,推测在白天和夜晚的日常周期中来自环境的线索,以及RNAPII在启动子和PAS附近暂停,对于适当的转录反应很重要,也可以起到检查点的作用,在新合成的转录物被适当地剪接、甲基化和/或标记用于核隔离和/或翻译之前,不允许释放新合成的转录物。
由于在拟南芥的多个器官和组织中发现了不同水平的mRNAs和蛋白质之间的相关性,因此应考虑转录和蛋白质丰度之间的对应关系。此外,拟南芥植物暴露在微生物相关分子模式elf18中,转录和翻译模式之间的相关性较差。最近在玉米中进行的一项综合研究还表明,大约一半高度丰富的mRNAs在蛋白质水平上没有表现出来。有趣的是,玉米和高粱之间的共基因和同源基因表现出高表达水平,产生蛋白质的可能性是非同源基因的9倍,这些发现表明高表达和保守的基因更有可能被翻译。然而,某些剪接变体的组成也会影响其翻译潜力,例如,3’或5’UTR中的IR可引入影响人类稳定性或翻译效率的顺式元件。同样,也有研究表明,植物利用5’UTR作为传感器,在胁迫条件下促进一些转录物的翻译。因此,通过AS的5’UTR二级结构的任何变化都可能影响翻译效率。考虑到它们的代谢状态、生长条件、光合作用速率和糖/淀粉储备的状态,笔者推断转录变异可能不是蛋白质多样性和丰度的唯一调控,植物可能对这些决定产生强大的影响。
3. AS和IDPs/IDRs:植物环境适应性调控的一种途径
IDPs或IDRs被称为垃圾蛋白质组,然而最近的证据表明,它们通过转录调节、细胞周期、伴侣形成和调节能力的增强来控制重要的细胞功能,特别是在胁迫条件下(图1)。有趣的是,高度保守的酶通常不会在IDR中富集,而多功能酶则含有超长的IDR。此外,大多数参与转录和RNA处理的真核蛋白质在IDRs中表现出强烈的富集,这些IDR在细胞中的无膜细胞器的形成中起作用,例如核斑点、异染色质域、压力颗粒和加工体。有趣的是,应激颗粒可以隔离和保护RNAs和蛋白质免受应激诱导的损伤,并在应激期间改变信号通路,如雷帕霉素复合物1(mTORC1)的哺乳动物/机械靶点。两个酵母研究的最新数据表明,内含子通过营养感应TORC1途径促进对胁迫条件的抵抗力是必不可少的。在第一项研究中,研究者发现内含子对于在饥饿条件下下调RPGs以促进野生型菌株的适应度至关重要。相反,由于RPGs和呼吸相关基因上调,内含子缺失菌株无法在这些条件下存活,导致生长失控和饥饿。有趣的是,切除的内含子在营养丰富的条件下迅速降解,在胁迫条件下积累为线性RNA。在第二项研究中,通过CRISPR-Cas9系统删除这些不寻常的剪接体内含子,通过TORC1介导的胁迫反应也导致更高的生长。内含子介导的生长反应调控在真核生物(酵母)中的存在是显著的,人们很容易推测,在高等真核生物中,至少有一部分生长和胁迫反应基因存在类似的机制。
剪切连接处核苷酸的偏倚分布对剪接体识别很重要,然而,剪接处和顺式调节元件之间的大多数核苷酸,促进无序氨基酸(赖氨酸、谷氨酸和精氨酸)编码。有趣的是,外显子剪接增强子在编码无序蛋白质区域的外显子中更为普遍,而在包括植物在内的许多分类群中,与结构区域相关的外显子相比。由于受AS影响的大多数蛋白质片段通常在本质上是无序的,因此这些蛋白质片段不仅可以改变三维结构,还可以改变它们的PTM,从而使它们在植物的生物和非生物胁迫条件下的功能和底物特异性进一步多样化。一般来说,人类蛋白质组的无序程度更高,然而,参与环境反应的基因在拟南芥中更为无序。在植物中,由于AS在胁迫条件下的普遍存在,需要在光合作用、资源分配和适应反应之间建立一个良好的平衡,以适应反应和生存,因此,通过IDPs作为PTM的调节方案在植物物种中更具相关性。在胁迫下,植物表现出染色质结构的重排,这也可能影响共转录剪接结果和差异剪接位点选择,并随着多样性的增加而增加。最近,研究表明,除了调节作用外,IDPs在许多大分子无膜细胞器的组织和组装中也起关键作用,包括亚细胞核、处理小体、应力颗粒和染色质结构域等。因此,IDPs在短期内可能有助于植物适应这种胁迫的调节。应激和阶段依赖性IDPs可以解释环境是如何通过AS调节其蛋白质的三维结构和PTMs的。因此,IDPs有可能提供转录、剪接和翻译调节因子的条件特异性和增强的调控网络,以及在压力条件下微调基因表达和细化给定组织中蛋白质组所需的伴侣蛋白(图1)。有人提出,患有AS和PTMs的IDP显著促进了蛋白质功能的多样化,并且可以缓冲不良变化。此外,非结构域中无序区域的存在可以帮助新功能化,避免结构域发生改变的蛋白质所承受的选择压力。
4. 翻译中光明的一面:翻译中的巧合
植物也具有“生物钟”,使生命活动与环境的可预测变化同步,这提供了竞争优势,并最大限度地提高了生产率先前研究的证据表明,白天的光合作用和淀粉合成速率,以及夜间燃料生长的资源利用,都是由植物时钟调节的,但也取决于光周期的长短和前一晚的生长。生理途径时钟控制的一个重要机制是通过RNA积累的节律调节,包括调节AS。成千上万的植物基因表现出有节奏的表达,昼夜都有高峰。这些RNA节律(主要是与光合作用、初级/次级代谢和色素生物合成相关的高代谢活性基因)与光周期相互作用,在光周期中,光周期的翻译率比黑暗中的高。植物将转录节律和翻译调节结合起来,通过一种叫做“翻译巧合”的机制来调节蛋白质在不同光周期中的表达。对于在光周期晚期达到峰值的RNA,光周期内较高的核糖体负荷只与较长光周期内较高的mRNA水平相一致。如果光周期在RNA之前结束水平上升,因此,每天的蛋白质合成可能会降低。在长光照条件下,如在夏季,提高蛋白质水平的一种方法是在对RNA合成的有节奏的高峰晚些时候进行调控(图2)。不同光周期拟南芥蛋白质组分析表明,参与初级/次级代谢和光合作用的酶更为丰富,植物在较长的光周期下表现出更高的代谢活性。在这些长光周期条件下,数百种具有节奏性RNA的蛋白质在白天晚些时候达到高峰,而在短光周期条件下,具有早高峰RNA的蛋白质含量更高。
由于特定基因的表达时间会影响其翻译模式,因此有必要问一个问题:对于可变剪接来说,这种模式是合乎逻辑的。事实上,光照条件调节SR30前体mRNA,SR30前mRNA编码一种参与拟南芥RNA剪接的富含丝氨酸/精氨酸的蛋白质,并影响其翻译模式。SR30(SR30.1)的剪接变体之一(SR30.1)在光照下迅速生成,并输出到细胞质中进行翻译,这从SR30.1蛋白质的丰度可以看出。相比之下,另一个剪接变异体SR30.2只出现在暗生长的幼苗中,并且在核糖体相关转录物中表现较差的核组分中富集。有趣的是,对暴露在不同波长光下的拟南芥黄化幼苗中砷的全球分析表明,在幼苗光形态形成过程中,许多事件从黑暗中的可能非生产性变体转变为光下的生产性变体。类似地,编码拟南芥另一种富含丝氨酸/精氨酸剪接因子的RS31基因在光照条件下产生三种异构体。其中,全长蛋白的mRNA1编码以及mRNA2和mRNA3保留在细胞核中。有趣的是,mRNA1的丰度在黑暗条件下显著降低,而RS31转录本没有显著下降。过度表达mRNA1的转基因株系在光照和暗照条件下分别为16小时和8小时,没有表现出表型;但是,由于叶绿素a和b的水平较低,因此与野生型或RS31突变体相比,它们在黑暗或低光照下会导致幼苗变黄和变小。有趣的是,用一种阻止电子从光系统II传递到质体醌库的药物处理的植物,模拟了黑暗对RS31 AS的影响,表明一种逆行信号从叶绿体传递到细胞核。这些数据表明,在黑暗条件下,通过AS下调mRNA1对拟南芥在光照变化下的正常生长发育至关重要。重要的是,来自叶绿体控制核事件的信号和像AS这样的复杂机制是有趣的,表明环境条件可以影响基因调控机制来赋予植物适应度。然而,值得注意的是,考虑到叶绿体和光合系统的进化历史,这种串扰可能需要很长时间才能形成。至于SR30和RS31基因可以作为一个强有力的模型来理解为什么有些剪接变体只在可变的环境条件下出现并翻译或保留在细胞核中。此外,这些结果支持这样一个观点,即植物的代谢状态在不同的光周期和/或胁迫条件下受到密切调控,部分原因是通过改变转录组的哪个部分会被翻译。由于在胁迫条件下转录物更为丰富,植物必须严格控制哪些mRNA物种将被翻译,以降低蛋白质合成的代谢成本。因此,有相当大比例的AS转录物(IR)要么被隔离在细胞核中,要么通过NMD途径降解。此外,由于植物在较长的光周期下表现出更多的蛋白质翻译,推断在胁迫下通过AS获得的更少的蛋白质成为以最小的能量成本维持基本调控质量控制。显然,需要进一步利用核糖体足迹和/或质量规范技术来阐明这一现象。
图2 光周期长度和长期变化的平移重合
在长光周期(白天以黄色表示)下,植物翻译其转录组的较高比例以产生更多的蛋白质,以支持更高程度的代谢活动。然而,在较短的光周期下(晚上和夜间分别以浅蓝色和深蓝色表示),核糖体负载量和翻译效率因需求量减少而降低。通过这种方式,植物可以根据不同的生理需要使用相同的转录组来调节它们的蛋白质组。此外,在不同的生长阶段(A-B-C),转录物丰度和蛋白质多样性之间的关系可能不是线性的,以保持理想的成本效益比和调控能力。
5. 结论与展望
所有生命形式都需要协调它们的转录组模式,以便在正常和压力条件下产生适当的反应。然而,在不同的生长发育阶段,植物转录体需要促进有效的碳固定及其在昼夜循环中的利用。因此,耐人寻味的是,植物在胁迫条件下会产生更多的剪接变异来微调它们的基因表达模式。因此,在有限的能量供应下,植物不太可能产生更多的蛋白质。此外,AS转录物可以产生无意义转录物,如果翻译,会导致蛋白质变短(图1)。同样,大多数IR转录本,如果翻译的话,会产生带有IDRs的蛋白质,并且可能不具有任何特定的功能。然而,大多数IR转录物被困在细胞核中,因此没有被翻译。因此,植物不仅可以改变它们的转录反应,而且可以通过隔离内含子的RNA和其他选择性剪接转录物来影响蛋白质组的组成。与酵母相似,植物剪接体内含子也可能在然而,还需要进一步的工作来阐明这一现象。或者,植物可以通过翻译一些在不同转录因子和剪接因子中包含IDR的AS转录物来产生额外的调节能力,从而增强与多个蛋白、酶及其底物相互作用的调节能力。这让人想起唐氏综合症细胞粘附分子(Dscam)蛋白,这种蛋白在果蝇的神经连接中是必需的。Dscam基因可以产生数千个剪接异构体。尽管所有剪接异构体共享同一个结构域,但免疫球蛋白结构域内的可变氨基酸具有结合特异性,并有助于形成复杂的神经元连接。以这种方式,亚型多样性为每个神经元提供了一个独特的识别位点,以促进自我识别,这对于果蝇的神经元信息传递至关重要。
AS在短期内增加了调节能力,但在长期内,只有当不同的组合经过多代的尝试和纯化选择之后,才有助于蛋白质的多样性。最近的一项研究表明,植物对热胁迫具有剪接记忆能力,只有在热胁迫下预处理的植株才会再次表现出对相同胁迫的反应。这种短暂的记忆可能是通过特定的染色质标记产生的,而这些标记又会产生由染色质介导的长期适应变化。这种策略在相似的条件、组织和/或发育阶段提供特定AS模式的时空顺序和复制。由于染色质状态也介导转录和剪接动力学,染色质环境不仅可以介导特异性AS结果,而且还可以作为表观遗传足迹,在未来发生类似压力的情况下触发类似的反应。作者认为,在不同的光周期和环境条件下,了解不同AS转录物与相关染色质标记物的转录和翻译动力学,将有助于理解AS对替代蛋白质组的影响。为了充分认识AS在基因调控和蛋白质多样性中的作用,不仅需要了解不同AS模式在短期和长期内出现的染色质背景,还需要通过酵母杂交系统和改良的质谱和液相色谱-质谱(LC-MS)技术,在不同人群和不同条件下以组织和条件特异的方式观察他们的伴侣蛋白。
评论
本综述概况了可变剪接如何在植物当中是如何将最终的蛋白产物会表现出不同或者是相互拮抗的功能和结构特性,或者在相同的细胞中由于表达水平的不同而导致不同的表型,对于科研工作者深入了解可变剪接具有科普的意义。