编译:罗睺,编辑:十九、江舜尧。
原创微文,欢迎转发转载。
导读
分子和细胞变化是衰老以及与年龄相关疾病的内在因素。先前的研究已表明年龄和遗传因素对基因表达和选择性剪接的综合影响。但是,这些分子变化没有长期的纵向特征,尤其是在老年人中。作者在70岁和80岁的相同个体的全血中进行RNA测序,以量化在这10年的群体和个体水平的晚期老龄化中,基因表达、选择性剪接及其基因调控是如何改变的。作者观察到,个体的表达谱与其他同龄个体更接近。鉴定了1291和294个基因的差异表达和年龄有关的可变剪接,以及个体离群轨迹的529个基因。此外,观察到在两个年龄之间,遗传效应对表达和剪接的影响有很强的相关性,一小部分受测基因在高龄群体中表达和剪接之间的遗传关联减少。这些发现表明,虽然转录组及其遗传调节在生命后期基本稳定,但一小部分基因是动态的,其特征是遗传调控减少,这很可能是由于年龄增长的环境差异造成的。
原名:Genetic regulation of gene expression and splicing during a 10-year period of human aging通讯作者:Brunilda Balliu、Erik Ingelsson、 Stephen B. MontgomeryPIVUS研究是一项基于人群的老年人心血管健康研究。PIVUS队列由2001年至2005年居住在瑞典乌普萨拉的1016名瑞典血统个体(509名女性和507名男性)组成。本文对参与者(年龄分别为70岁和80岁)进行了表型分析,并在收集血液后立即冷冻。在65位个体(35位女性;30位男性)130个样本中,对基因表达进行了定量分析(n=2)。并在Illumina OmniExpress和Cardio-Metabochip阵列上进行基因分型(检测700K以上的SNP)。对得到的基因表达数据进行质量控制和背景噪声校正后,进行层次聚类、差异表达、富集分析。本研究介绍了基因表达和替代剪接变化的第一个长期纵向表征,以及它们作为生命后期衰老的遗传调控功能。并且量化了基因表达、选择性剪接和基因调控(表达和剪接数量性状位点;eQTLs和sQTLs)在这10年期间的变化。为了量化个体内基因表达水平的稳定性,作者测量了两个时间点之间基因表达的相关性,并基于样本到样本的距离矩阵进行了层次聚类(图1a)。鉴定的基因表达的个体的基因中度相关且表达谱高度相似,在93%的样本中,两个年龄段的同一个人的测量值聚集在一起(图1a)。
作者研究了转录组范围内基因表达随年龄的变化(图1b)。发现了1291个基因(占测试基因的8%),其表达水平与年龄显著相关(FDR 5%)。Harris等人在70 - 76岁间观察到相似数量的淋巴母细胞样细胞系差异表达基因。DE基因在多种与衰老相关的途径(图1c)中显著富集(FDR 5%),如蛋白质代谢、氧化磷酸化和DNA复制。此外,这些DE基因中的18个与复杂性状相关,全血中的基因表达水平可调节疾病的风险。对于大多数这些基因,衰老将其表达推向与疾病风险增加或风险因素水平更高相关的方向。例如,rs7941030中的C等位基因与UBASH3B的表达降低有关,UBASH3B的表达随着年龄的增长而下调,并且胆固醇水平升高。因此,衰老会推动UBASH3B的表达向与总胆固醇增加有关的方向发展。对于一些基因,衰老将表达推向降低疾病风险或风险因素水平的方向,特别是对于血压性状。衰老与血压之间的这种负相关关系可能是由于以下事实:本研究中的一些人开始使用降低70至80岁之间血压的药物,这反过来导致SBP和DBP随着年龄的显着降低。应该注意的是,与DE基因相关的大多数性状都是心脏代谢性的,例如甘油三酸酯,总胆固醇和血压。为了进一步量化年龄对基因表达的相对影响,作者估计了由年龄解释的表达差异的比例:年龄解释了与年龄显着相关的基因表达差异的1.5%。作者使用来自人类PBMC(CHARGE)和全血(SardiNIA)衰老的两项大型横断面研究的汇总统计数据,对计算机中的DE基因进行了验证。分别有76%和51%的DE基因在CHARGE和SardiNIA组随年龄变化而差异表达。此外,发现本研究中前1000个DE基因与另外两个研究前1000个DE基因之间存在显着重叠。在49个重叠的DE基因中富集了与适应性免疫应答途径有关的GO项。在所有研究中,这49个基因中只有65%随年龄的变化方向相同。可以通过三项研究中样本年龄分布的差异来解释这种差异,并且可以反映年龄对表达的非线性影响。这也可能是表达分析方法不同的结果:CHARGE基于阵列,而PIVUS基于测序。为了研究细胞类型组成对本研究差异表达结果的影响,作者将DE基因列表与547个基因列表进行了对比,该基因可以区分22种人类造血细胞表型,包括7种T细胞类型,初始和记忆B细胞,浆细胞以及NK细胞等。发现细胞类型组成对结果的影响很小,只有4.5%的DE基因和5%的DE前100位基因是细胞类型特异性表达的特征基因。本研究的纵向设计使作者能够研究个体水平表达谱随年龄的变化。这种个体水平的变化可能是由于多种个人环境(即疾病,饮食,药物)引起的,作者假设离群轨迹可能反映了某些特定于个体的衰老差异。作者搜寻年龄离群轨迹个体(图2a),从529个独特基因中发现了555对个体-基因异常对(图2b);其中60%的表达随着年龄的增长而明显下降,6%的表达也随着年龄的增长而达到人群水平。只有5%的年龄离群轨迹基因是细胞类型特异性表达的标记基因,这表明细胞类型组成的影响很小。个体基因异常值的中位数为4,14%的个体没有异常值,13%的个体有20多个异常值(图2c)。随着年龄的增长,IGKV1-27基因的异常表达增加最多,该基因负责抗原结合并参与适应性免疫应答。BIRC2是一种调节细胞凋亡、调节炎症信号和免疫、有丝分裂激酶信号和细胞增殖的基因,随着年龄的增长,其表达下降幅度最大。
对每个个体的异常基因进行了GO生物学过程的富集分析(图2d)。对于随着年龄的增长而表达减少的基因,观察到三个个体的与年龄相关的已知GO项的显着富集(FDR≤5%)。其中一个在两个年龄段之间显示白细胞计数大幅增加,免疫反应相关的项有所增加。另一个体中,观察到与蛋白质分解代谢有关的项富集,该个体在两个年龄之间的白蛋白水平显着增加,并被诊断为70至80岁之间的糖尿病。个体水平中,表达量随年龄增长而异常值增多的基因并未富集任何特定功能。使用线性回归模型评估了每个年龄组中每个常染色体基因的表达与常见顺式遗传变异之间的关联。为了最小化两个年龄之间的统计功效差异的影响,作者发现并校正了在每个年龄组中分别最大化eQTL发现的隐藏因素的数量(图3a)。经过背景噪声校正后,在70岁年龄段检测到1326个eGene,即具有至少一个显着eQTL的基因(8.5%的测试基因,FDR≤1 %);在80岁年龄段发现1264个eGene,相比而言,eGene的损耗具有统计学意义。
基因表达随环境暴露而改变。为了解决eQTL效应随年龄变化的稳定性问题,发现eGenes从一个年龄组到另一个年龄组的复制率(图3b)。观察到每个年龄的eGenes的高复制比例,在70岁的eGenes中有92.2%的eGenes在80岁时被复制(FDR 10%)。为了解决遗传变异的相对贡献问题,作者使用二元线性混合模型估计每个年龄组中每个基因的顺式遗传力(图3C)。发现随着年龄的增长,顺式遗传力平均值略有下降。平均遗传力从70岁时的18%下降到80岁时的17%。作者还估计了两个年龄段之间表达的遗传相关性(图3d)。对于80岁时eGene的损耗、70岁时复制率较低以及顺式遗传力随年龄的降低略有下降,有两种简单的解释:一是遗传变异的影响随着年龄的增长而降低;二是环境扰动的影响随着年龄的增长而增加。后一种解释得到了遗传效应的强相关性以及基因表达随年龄变化的eQTL缺乏的支持。总之,这些发现表明,对基因表达的遗传影响在生命的后期基本上是稳定的,并且环境扰动随着年龄的增长而逐渐增加,从而导致SNP遗传力估计值降低,并且随着年龄的增长,检测eQTL的能力也降低。将eGenes与年龄相关的DE基因进行了对比。不同年龄的eQTLs基因的表达差异有统计学意义,分别为7.2%和9.7%。有2%的基因表现出随年龄变化而丧失的基因是细胞类型特异性表达的特征基因,这表明本实验观察结果不太可能是由细胞类型组成随年龄变化而改变的。作者研究了随年龄增长的转录组广泛的等位基因特异性表达(ASE)模式。在全球水平上,个体内的参考等位基因比例基本一致(图4a)。观察到等位基因失衡(AI)随着年龄的增长而增加了2.6%(图4 b)。在地区水平上,作者关注ASE随年龄的群体和个体水平的差异。前一种分析要求位点是跨多个个体的杂合子,并捕获与年龄交互的顺式调控效应,而后一种分析则捕获罕见/个人变异或体细胞突变的效应,如克隆造血。
图4 整个基因组中种群和个体水平的等位基因特异性表达
在群体水平上,来自六个基因的位点显示随年龄的显著的ASE差异(FDR≤5%;图4 c)。HLA-DRA,NCOR2,和PLEKHO2显示随年龄的增加而显著增加,而CLEC7A,OAS1和HLA-DQB1随着年龄的增长显著下降。这些基因中的大多数都与免疫系统有关,并且在此之前已经被证实与衰老过程有关。最值得注意的是,NCOR2在过氧化物酶体增殖激活受体(PPAR)靶基因启动子上的表达及其占用率在主要代谢组织中随年龄增长而增加。通过选择性地使其两个主要受体相互作用区域中的一个失活,将其抑制活性转向PPARs,导致小鼠过早衰老和相关代谢性疾病,同时伴有线粒体功能和抗氧化基因表达减少。CLEC7A是一个巨噬细胞特异性表达的特征基因。
在个体水平上,6个个体在3个基因的4个位点上表现出年龄差异的ASE(FDR<5%;图4d)。GNAS在个体水平,AI随年龄增长而显著下降。其中有两个个体显示随着年龄的增长,SH3BGRL3的AI显著下降,该基因的表达均值在人类皮肤中显示出随着年龄的增长而降低,其表达方差在大鼠视网膜中显示出随着年龄的增长而增加。最后,在CD52的两个外显子SNP中,3个个体的AI随着年龄的增长而显著增加,而1个个体的AI则下降这些基因中没有一个随着年龄增长表现出显著的去甲肾上腺素,也没有一个已知具有细胞类型特异性表达。作者研究了选择性剪接随着年龄的全转录物变化的关联,并从294个基因,其剪接水平随着年龄(图5),这些基因中有11%的年龄也显示出显着的DE。GO富集分析显示与RNA剪接,细胞凋亡和白细胞分化调控相关的GO项有显着富集。发现与昼夜节律有关的基因与年龄之间最强的关联(图5a),其破坏会加速衰老(SFPQ,PER1和SETX)。SFPQ通过抑制CLOCK-ARNTL异二聚体的转录激活因子活性来调节昼夜节律,并在调节DNA病毒介导的先天免疫应答中发挥作用。SFPQ的内含子保留和核丢失是肌萎缩性侧索硬化症(ALS)的分子标志。PER1是周期基因的成员,以昼夜节律模式在视交叉上核中表达,视交叉上核是哺乳动物大脑中主要的昼夜节律起搏器。SETX参与转录终止,DNA双链破坏了由氧化应激产生的损伤反应。该基因的突变与少年ALS相关。SETX PER1和CRY2的转录终止也需要“β-内酰胺基”,因此在昼夜节律调节中起着重要作用。
作者研究了影响每个年龄段常染色体上可变基因剪接的遗传变异。校正背景噪声后(图5 b),检测到在70岁550点的内含子,并在80年龄509点的内含子。相对于70岁,在80岁时具有至少一个重要sQTL的内含子(sIntrons)的消耗具有统计学意义。为了研究sQTL效应随年龄变化的稳定性,作者估算了一个年龄组中发现的sIntrons在另一个年龄组中的复制率(图5c)。观察到两个年龄的复制比例都很高,在70岁时发现的sIntrons中有90.4%在80岁时被复制。最后,观察到两组之间的sQTL效应大小有很强的相关性(图5d),并且没有sQTLs来反映随年龄变化的选择性剪接。这表明,与基因表达类似,基因对选择性剪接的影响在生命后期基本稳定,随着个体年龄的增长,环境噪声的增加导致了sQTLs的丧失。本文研究了年龄和遗传因素对基因表达和选择性剪接的综合影响,这些样本来自间隔10年两次的普通人群中的65个人。作者将重点放在70岁和80岁的老年人身上,目的是在高发病率和高死亡率期间捕获转录组的变化。作者观察到两个年龄段的个体与其自身基因表达水平相比,与相同年龄段的其他个体更相似。这表明与晚期衰老过程相比,共同的遗传和环境可以解释更大比例的基因表达差异。尽管随着时间的推移,表达谱在个体内相对稳定,但我们能够识别出表达发生显著变化的1291个基因。与适应性免疫系统、细胞信号转导和炎症反应相关的通路表达下调基因,而与氧化磷酸化、适应性免疫系统和蛋白质代谢相关的通路表达上调基因。这些功能中的许多功能先前已被描述为代表衰老的共同指标的标志。此外,18个差异表达基因以前被认为是复杂的特征相关基因,基因表达水平调节风险。由于每个人的衰老速度不同,随着年龄的增长,人与人之间的差异也越来越大。因此,实际年龄并不能准确地反映衰老过程。纵向研究通过研究同一个人的整个寿命,可以更好地理解衰老过程。通过收集系列评估,可以将个人与他们在不同时间点的研究指标进行比较,而不是将来自不同环境的不同年龄的人进行比较。最近的纵向研究已经开始强调个人层面分子谱的重要性,以确定重要的健康因素。本研究借助纵向研究分析基因表达的个体变化,并鉴定出529个具有与蛋白水解和免疫应答调节相关功能的个体动态基因。在群体和个体差异表达基因中,免疫相关功能的共享可能在某种程度上,这可以通过观察免疫失调和随年龄增长的转录变异性来解释。基因表达的遗传调节涉及许多复杂的人类特征。先前在模型生物中的研究报告说,这些关联随着年龄的增长而降低。然而,人们对基因的失调程度随年龄的增长知之甚少。在人类的横断面研究中,分别确定了针对三个和十个基因的特定年龄的eQTL 。一项较小的为期2年的中年女性纵向研究发现,两个基因具有时间依赖性。本研究结果表明,随着年龄的增长,遗传控制和基因表达的遗传力总体上会出现小幅但显着的下降。这种减少可能是由于多种因素引起的,例如转录因子表达水平的降低,表观遗传修饰或基因组不稳定。值得注意的是,虽然衰老导致遗传控制的减少,但作者观察到等位基因特异性表达水平随年龄增加。遗传效应与随年龄增加等位基因失衡具有高度相关性表明,环境方差的增加(不是遗传方差的减少)是遗传力降低和遗传效应丧失的一个组成部分。目前还没有关于人类转录组的纵向研究评估选择性剪接的动力学及其遗传学。作者发现了294个基因与RNA剪接和细胞凋亡的调控相关,包括年龄特异性的选择性剪接。在与年龄相关性最强的前10个基因中,有3个与昼夜节律有关,昼夜节律的中断被认为会加速衰老。除了可变剪接随年龄的变化外,作者还观察到两个年龄之间剪接的遗传关联数量减少,这突出了表达和剪接的调控异常的相似模式。总而言之,本文提出了表达和剪接变化随年龄和遗传学变化的第一个长期的纵向特征。研究表明,尽管基因表达和选择性剪接及其遗传调控在生命的后期大多是稳定的,但一小部分基因是动态的,其特征在于表达和剪接的变化以及遗传调控的降低,这很可能是由于环境差异的增加。