科研 | AGING CELL:灰鲸转录组揭示长寿适应性与DNA修复和泛素化相关

编译:Mr.J,编辑:十九、江舜尧。

原创微文,欢迎转发转载。

导读

灰鲸是寿命长度位于前1%的哺乳动物之一,对环境具有极强的适应性,尽管其栖息环境极端恶劣(间歇性低氧、北极水和高压的环境),根据已有的研究,灰鲸最长寿命至少能达到77岁。不同物种间的基因组和转录组的差异如何决定物种的最长寿命,是衰老研究中的一个重要问题。由于缺乏非模式生物的样本,以及难以直接比较来自不同物种的转录组,该领域进展困难。在本文中,作者从头组装灰鲸的转录组,并提出了一种基于排序的新方法,用于将灰鲸与其他七种哺乳动物的从头组装转录组进行比较分析,进而分析灰鲸中寿命相关基因表达模式。研究表明,长寿的不同的哺乳动物拥有共同的基因表达模式,一些基因的表达显著高于短寿命物种,包括DNA维护和修复、泛素化、细胞凋亡和免疫反应相关基因。研究者还发现,在灰鲸中,寿命相关基因的表达水平,决定其对灰鲸寿命所起的作用和作用方向。此外,研究者还观察到在高表达的促长寿的基因中,许多基因与压力有关,这表明灰鲸对极端环境条件的适应性。这项研究为长寿命和短寿命物种的寿命相关基因表达的广泛比较分析开辟了一个新的途径,这可能是未来研究的一个重要课题。同时,研究者组装的灰鲸转录组也为维持濒临灭绝的灰鲸种群提供了重要的资源。

论文ID

原名:Gray whale transcriptome reveals longevity adaptations associated with DNA repair and ubiquitination

译名:灰鲸转录组揭示长寿适应性与DNA修复和泛素化相关

期刊:AGING CELL

IF:7.627

发表时间:2019年11月

通讯作者:Alexey A. Moskalev & Vadim E. Fraifeld

主要作者单位:以色列本古里安大学卫生学院Shraga Segal微生物学、免疫学和遗传学系;俄罗斯科学院乌拉尔分院科米科学中心生物研究所

DOI: 10.1111/acel.13158

结果

灰鲸转录组的组装和注释

为了获得灰鲸的转录组数据,研究者使用MiSeq系统Illumina测序仪对一只年轻成年雌性鲸鱼的肾脏和肝脏mRNA进行测序,从头组装转录组,共产生114 233个contig。研究者使用SProt算法鉴定编码在转录组中的同源蛋白编码基因,并以UniProt序列为参考数据库进行BLAST,共鉴定了12 072 个蛋白编码基因,这些基因比对到7997 个UniRef90簇(具有90%同一性的蛋白质簇)。这意味着研究者发现的每一种蛋白质在至少一种或多种哺乳动物物种中都有同源性。其中,11456个蛋白编码基因表达于肝脏和肝脏,8363个在肾脏,两种组织间有64%的蛋白编码基因高度重叠。除了已鉴定的基因外,大量的未鉴定的contig也具备判定为编码序列的标准(一定的长度和表达水平)。

灰鲸高表达基因的富集

为了解哪些基因亚群在肝脏和肾脏两种组织都高表达,或哪些基因亚群可能代表有机体中最活跃的过程,研究者对表达量前100的基因(根据contig 相对于全基因的计数)进行Gene Ontology (GO)富集分析,发现到一些在肝脏和肾脏共同出现的有趣的特征。首先,研究者发现与胞外基质(ECM)、细胞-细胞/细胞-胞外基质相互作用和外泌体相关的GO分类大量存在;其次,在高表达基因中显著富集与免疫反应、器官再生和细胞增殖调节相关的GO分类;最后,研究者还发现,正如根据对其他物种的观察所做的预测,灰鲸的许多高表达基因都属于线粒体相关的类别。

灰鲸转录组中的未知基因

为了进一步研究未注释的序列,同时排除由于序列映射造成的假阳性,研究者接下来只选择计数高的、高表达、序列长度> 200 bp以及与普通mRNA的大小相当的contig。在10389个未注释序列中,前600个序列的表达量显著偏高,比转录组平均表达量高10倍。在这600个未注释的序列中,表达量前100的基因中有4个未知序列;在前1000个未注释序列中,有92个未知基因,该数据表明这些未知基因的功能意义值得进一步研究。

研究者选择了前20个高表达的转录本,并以NCBI RefSeq核苷酸数据库(Haft)为参考数据库进行手动BLAST,搜索相似的序列或域或基序。有趣的是,这20个转录本在其他物种转录组中也是高表达的,包括露脊鲸和小须鲸的转录组。研究者又使用Swiss-Prot、Pfam和MEME Suite工具检索这20个转录本,但没有显著匹配到域或基序。然而,研究者通过BLAST在其他物种中发现了与20个转录本高度相似的预测蛋白或者转录本的几个序列。其中包括与核糖体RNA、锌指代谢过程、ERK信号和细胞骨架重塑(ACTB)、活性氧解毒、泛素化、增殖、分化和致癌(PRDX3 CALR),免疫应答(组织相容性复合体II类和扩展II类亚区,NDRG1, PTMA, GPS2),线粒体,ATP代谢与铁结合(PAH, CYP1A1),癌症的衰老与自噬(CREG1, CAAX box蛋白),脂蛋白与胆固醇代谢过程(APOA2),细胞异质体的调节。有趣的是,上述许多基因都参与了与衰老相关的途径。

基于新方法比较分析灰鲸和其他哺乳动物的转录组

为了鉴定物种特有的或跨物种保守的基因表达模式,研究者对灰鲸和其他7种哺乳动物的转录组进行了比较分析,包括另外2种鲸鱼(露脊鲸和小须鲸)和5种陆地哺乳动物(裸鼹鼠、布氏蝙蝠、小鼠、牛和人类)(图1)。由于不同的实验的测序方法或测序设备的异质性、样本制备方案的差异、校准和组装过程中的潜在误差,无法直接比较不同物种的转录组中个体基因的表达水平。为了更大程度减小对不同物种比较分析时产生的偏差,研究者采取了以下对策:在功能相关基因簇的水平上对不同物种进行比较;将每个物种样品的read counts转化为TPM(Transcripts Per Million)作为标准化数值,再对TPM排序,每个基因在每个样品数据集的排名则作为比较分析的依据。于是,研究者根据GO分类对蛋白质编码转录本进行分组,并计算每个GO分类的TPM,然后根据TPM进行排序。

图1:灰鲸与其他哺乳动物的关系

为了验证基于排序的新方法的有效性,研究者在一个给定的GO分类中比较分析物种内方差和物种间方差。结果显示,种内方差远低于种间方差。在一个给定GO分类上,系统进化上亲缘关系很近的物种比关系远的物种有更相似的排名。Spearman相关分析表明,同一物种或关系近的鲸鱼的GO转录水平排名具有较高的相似性。两组小鼠实验Spearman的秩相关系数为0.97,牛实验为0.98,鲸鱼类为~0.85,肝脏和肾脏组织均具有较高的统计学意义(p < E-25)。此外,研究者也对灰鲸与其他哺乳动物的GO排序进行比较分析,结果显示灰鲸与其他哺乳动物的GO排名值的相关性较低(~0.6, p < E-25)。这些结果为基于GO排序的有效性提供了间接但也相当有力的证据。

使用基于排序的新方法,研究者对在长寿物种高表达并在短寿物种低表达的保守的生物学过程进行深入分析。结果显示,在长寿物种高表达并在短寿物种低表达的保守的生物学过程:DNA维护和修复(图2 A1, A2),泛素化(图2 B1,B2)和一定程度的凋亡(具体GO分类包括:“细胞凋亡信号通路对DNA损伤的正向调控”、“内切核苷裂解”、“内脱氧核糖核酸酶活性的正向调控”、“半胱氨酸型内肽酶活性参与凋亡执行阶段的正向调控”)

此外,与免疫应答相关的GO分类(白介素-2产生的正调控、T细胞受体信号通路通路的正调控、活化的T细胞增殖的正调控)的表达在长寿物种之间高度相似。

图2:跨物种比较的转录组GO分析热图

分析还发现在裸鼢鼠中DNA维护和修复、泛素化(图2 A, B)、凋亡、t细胞受体信号通路的正调控和t细胞增殖的活化具有较高的表达水平,裸鼢鼠是一种啮齿动物,长寿且具有显著的抗癌能力。相比之下,在小鼠和奶牛转录本中,上述类别的生物过程的表达水平要低得多。而在人类中,大多数GO分类的表达水平排序更接近鲸鱼和裸鼹鼠。

此外,已有研究表明,上述GO类别在抗癌机制中起着重要作用,可以防止细胞转移或消除潜在的致癌细胞或癌细胞,以及在更大意义上决定哺乳动物寿命

除了抗癌能力的相似性分析之外,在比较长寿和短寿物种时,对表达水平排序的相关分析还揭示了某些GO分类的一些有趣的模式。例如,DNA修复过程的表达水平分别在长寿物种之间(鲸鱼、人类、蝙蝠、裸鼹鼠;p < 5E-4)和短寿物种之间(奶牛和小鼠各有2个转录组;p < 5E-4)呈现正相关(图2 A2)。长寿命物种和短寿命物种之间在表达水平排序上呈负相关(p < 5E-4)。泛素化过程(图2 B2)和其他过程如凋亡和免疫应答也可以观察到类似的结果。

灰鲸转录组中长寿相关基因的分析

目前已有数百基因通过遗传操作的手段在模式生物(比如酵母、蠕虫、果蝇和小鼠)中被证明与寿命有关。这些基因在先前被定义为longevity-associated genes (LAGs),分为两类:1.能够促进延长寿命的基因;2. 缩短寿命即加速衰老的基因。

研究者提出一种假设,在长寿物种中,正调控长寿基因的表达水平应该高于负调控长寿基因,该猜想在先前还未有研究证明。为验证该假设,研究者从RefSeq数据库中提取GenAge数据库中包含所有LAG的序列,并将其与灰鲸转录组进行BLAST。研究者使用VSEARCH检索到了1422个已知的LAG,(这些LAG先前在小鼠,果蝇和蛔虫中被发现),其中有601个促长寿基因,821个抗长寿基因。经过进一步质控和去除冗余基因后,结果显示,有113 (19%)个转录本比对到已知的促长寿基因,只有77(9%)个转录本比对到已知的抗长寿基因

绝大多数的LAG是由超表达实验发现的,研究者在灰鲸中也发现了这些LAG的同源基因,其中有30种促长寿同源基因,3种抗长寿同源基因,这些LAG是在小鼠,果蝇和蛔虫中发现的。在灰鲸转录组中,30个促长寿基因的标准化表达水平(TPM)比抗长寿基因的平均标准化表达水平高出好几倍(图3)。

图3:长寿相关基因表达的差异倍数

与灰鲸整体转录组的平均基因表达量相比,促长寿基因在灰鲸的肝和肾的表达分别高达平均水平的2.6倍和4.9倍(p < 1.37E-6; p < 8.42E-6)。三个抗长寿基因则低于整体转录组的平均表达量,在肝和肾中分别是平均水平的68%和34%( p < 5E-4)。在小鼠中,尽管检索到了相似数量的LAG,但寿命相关基因并未呈现与灰鲸相似的表达趋势。

另外,研究者还发现,上述在灰鲸转录组中比对得到的LAG有很大一部分是和压力相关的(19/30),并且这些压力相关LAG高于转录组平均水平或者中位数水平。例如,热击70 kDa 蛋白 1A 基因在灰鲸中是高表达的,大约高达短寿物种表达水平的118倍。有趣的是,这个基因在裸鼹鼠的表达量也很高(是整个裸鼹鼠转录组平均表达量的8倍)。相反,类胰岛素生长因子1 (IGF-1), 一个抗长寿基因,在灰鲸以及其他鲸鱼物种中,表达量明显低于小鼠(在肝和肾中分别比小鼠少18.7倍和10.6倍)。

研究者推测,如果在模式生物中一些给定的LAG被敲除或者被沉默后导致寿命延长,那这些LAG在成年灰鲸中表达量会比较低或者不被检测到。于是研究者选取了这一类LAG在灰鲸转录组中比对,在肝中,检索到72个此类基因,其中57个基因低于转录组平均表达水平(72%);在肾中,72个此类基因中有39个基因低于转录组平均表达水平(54%)。在肝中体现的变化趋势(相比平均水平减少3.8倍)比在肾中明显(相比平均水平减少1.2倍)。

表1:灰鲸转录组中检索到的源自超表达实验的长寿相关基因

如表1所示,在灰鲸转录组中,促长寿LAG的同源基因表达明显高于平均水平,这些基因也已在模式生物中被通过超表达实验证明其超表达后能够延长寿命,与此同时,灰鲸中部分与已知长寿相关基因关联的同源基因,也已被证明其下调会导致模式生物寿命缩短。

讨论

研究者在对未知基因分析中,通过使用参考数据库比对分析,发现灰鲸转录组中高表达的未知基因在其他物种中也有高表达的现象,并检索到了一些与未知基因高度相似的预测蛋白。而一个更广泛的问题是,这些未知基因是否对基本的生物过程至关重要。在这方面,Hutchison等人合成了一个仅包含473个必需基因的功能上可行的人工基因组,其中近三分之一(149个基因)没有已知的生物学功能(Hutchison et al., 2016)。这表明即使在一个极度简化的基因组中,未知基因仍然存在。这表明在灰鲸转录组中发现的许多未注释的基因可能与基本生物学过程有关,对此研究者建议许多在灰鲸转录组中发现的未注释的基因应该作为进一步研究的重点。

研究通过分析跨物种的保守的基因表达模式,发现灰鲸和其他长寿物种之间在与长寿有关的生物学过程的高度相关性。于是认为,因为源于现有的有限的信息,目前所接受的关于灰鲸最长寿命为77岁的记录可能是一个不准确的估计。

在长寿相关基因研究上,关于源自超表达实验的LAG的可靠性,研究者强调两点:1.在研究者先前的研究表明,尽管进化距离很高,但在不同模式生物中操纵同源LAG所获得的寿命效应主要导致了一致的结果(Yanai et al., 2017);2. 在评估特定基因对寿命的影响方面,那些导致寿命延长的实验,甚至那些超表达LAG导致寿命延长的实验,比那些导致寿命缩短的实验更明确(Yanai et al., 2017)。这意味着关注和运用由超表达实验找到的LAG将更加明确和得到肯定。

研究者分析长寿相关基因后发现,在灰鲸转录组中发现的抗长寿基因和促长寿基因都比预期要少,这似乎不符合LAG较高的进化保守性。研究者对此作出解释:鲸没有参考基因组,转录组是从头组装的,但对于模式生物,基因组和转录组都有相对充分的注释,所以出现这样的结果也是能够预料的。

通过对全转录组的分析,研究者发现促长寿基因相比抗长寿基因具有更高的表达的水平,而在先前已有的对模式生物的寿命基因相关研究中,抗长寿基因是多于促长寿基因。研究者对此做出解释:1.从进化的角度上看,抗长寿基因中并不趋向于被长寿物种持续保留,所以抗长寿基因不完全存在于灰鲸基因组中;2.一些抗长寿基因在年轻的成年灰鲸可能是沉默,的或者表达量很低的,但它们会在生命后期表达量出现或者增高;3.还有一些抗长寿基因可能在灰鲸的整个生命阶段都会表达,但是表达量很低,但由于技术原因没有被检测到;4.一些抗长寿基因可能在环境条件下才会表达。

先前有研究认为,应激反应基因的上调可能导致延长寿命的效应(Moskalev等,2014)。研究者之前的研究进一步支持了这一观点,他们发现在大多数情况下,与压力相关的过表达滞后会导致寿命延长(Yanai et al., 2017)。在该研究中,研究者发现灰鲸促生长的LAG中有较高的比例与压力有关,这与先前的研究结果是相一致的。

该研究提出的方法,为长寿命和短寿命物种的LAG表达的广泛比较分析开辟一个新的途径,这可能是未来研究的一个重要课题。同时,通过对灰鲸转录组的分析以及与其他哺乳动物物种转录组比较分析,发现在DNA修复和泛素化功能上保守独特的基因表达模式,并反映灰鲸具有对癌症和压力的高抵抗力,这在一定程度上解释灰鲸的长寿适应性。


更多推荐

高分综述 | Trends in Biotechnology: 单细胞分辨率下利用空间转录组揭示器官分子结构(国人佳作)

重磅综述 | Cell:非编码RNAs在肿瘤学中的作用(IF=36.216)

(0)

相关推荐