科研 | Am. J. Hum. Genet.:在西班牙裔社区健康研究中,一项全基因组相关研究发现了人类代谢组的46个基因座
编译:阿温,编辑:Tracy、江舜尧。
原创微文,欢迎转发转载。
人体代谢物水平的变化反映了体内平衡的变化,为了解健康和疾病提供了一个窗口。在西班牙裔这个心脏代谢疾病高发的人群中,基因对循环代谢物的影响很大程度上是未知的,我们对3,926名西班牙裔社区健康研究者/拉丁裔参与者的640种循环代谢产物进行了全基因组关联分析,其中,640种代谢物的遗传力估计在0%-54%之间,中位数为2.5%。在两项以人群为基础的研究中,我们发现了46种具有普遍效应的不同代谢物对,并确认了301种已知地点的代谢物关联,所鉴定具有普遍效应的变异有一半位于基因中,其中包括5个非同义变异。我们在表达量性状位点105和151个已知基因座代谢物位点还发现了共定位,rs5855544位于SLC51A的上游,与三种类固醇硫酸盐的较高水平相关,并与SLC51A在多个组织中的表达水平共定位。而孟德尔随机化(MR)分析也确定了几种与冠心病(CHD)和2型糖尿病相关的代谢产物,例如,位于CYP4F2或附近的两个与维生素E代谢有关的变异体(分别为rs2108622和rs79400241)与十八酸二酯和维生素E代谢物的水平相关;磁共振分析显示,这些代谢物的高基因水平与冠心病的低发病几率有关。我们的发现揭示了一个未被充分展示的西班牙裔/拉丁裔社区循环代谢物的遗传结构,解释了疾病的病因学。
论文ID
实验设计
图1 研究方案设计
实验结果
1. Genotype-Phenotype分析
我们对3,926名HCHS/SOL参与者进行基因分型和估算变异的GWAS,这些参与者的平均年龄为46岁,43%为男性,图1展示了我们的研究设计、统计和功能分析,以及已知和之前未报道的研究结果概述。
我们鉴定了81,604个变异代谢物,其中608个显著的单变量代谢物是独立的,包括429个独特的变异,平均方差解释为3.5%,而它们中有378对已知,230对之前未报道。正如预期的那样,评估的低频变异对代谢物水平的影响比普通变异大2.53(平均影响为0.77) (低频和普通变体在每个次要等位基因改变0.77 SD和0.30 SD时的平均效应分别如图2A所示),大约60%的变异属于基因,其中包含14%的外显子变异(图2B)。
在378个已知的变异代谢物中,我们复制了171个先前报道的变异代谢物关联;另外207个独立变量-代谢物关联位于已知代谢物基因座内。在其余230对未报道的变异体代谢物中,其中46对中的41个独特变异体和39个代谢物在ARIC和/或TwinsUK研究中被成功复制(图3),所解释的方差范围从1%到22%(表1),此外,我们在NAT8 (N2-乙酰赖氨酸)和TPRKB (N-乙酰精氨酸)中检测到最强的是N-乙酰基氨基酸。而6个基因座(NAT8, FOLH1,ACY3, CPS1, SLC51A, UCA1-CYP4F2)影响了不止一种代谢物,在之前未报道的46对泛效应中,我们报道了12个代谢物和6个基因座(PCMT1、PTER、FOLH1、TMEM86B和EEF1A2)的遗传效应,这些基因座之前未显示与任何其他人类代谢物相关。
在本次研究中涉及到的640种代谢物里,有366个代谢物具有阳性的估计遗传力(h2),HCHS/SOL参与者的平均值为0.111,范围从0到0.539。遗传解释了50个代谢物中20%的个体间变异,而氨基酸相关代谢物(如N-乙酰天冬酰胺(h2 = 0.539)和N-乙酰天冬酰谷氨酸(h2 = 0.464))倾向于有最高的遗传力估计值。
图3 39种代谢物的曼哈顿图与46种先前未报道的普遍效应的发现相关
2. 代谢产物与eQTLs的共定位
为了更好地描述所鉴定的GWAS基因座的潜在遗传贡献,我们对GTEx V7中158个基因表达的代谢物基因座进行了共定位分析,以了解它们是否也可能影响不同组织中的基因表达水平。78个基因位点的136个变异、339个变异代谢物被发现有共同定位的证据(包含有54个基因座),其中一个潜在的因果变异是单一基因和代谢物表达的基础。12个先前未报道但具有普遍效应的独立变异被鉴定为与45个代谢物和22个eQTLs基因在不同组织中共定位(图4),表明这些基因的表达可能与该位点代谢物水平的变化有关。而22对既往未报道的广义变异基因eQTL中,41%归因于4个非同义变异(rs324420-FAAH, rs1047891-CPS1,rs948445-ACY3, rs2108622-CYP4F2),两个内含子变异体与注释的同一基因共定位(rs376277540-SLC51A和rs2304913-BBOX1)。
图4 先前未报道的泛效应的变异代谢物对共定位与基因eQTLs的联系
3. GWAS基因座功能注释
我们进一步使用PhenoScanner来确定在本研究中检测到的41个先前未报道但具有普遍效应的独立变异是否也与其他性状和疾病相关,以改进我们的GWAS基因座功能注释。在65种表型中,有12个变异在全基因组范围内具有显著性,包括血脂水平、血细胞特征、凝血相关因素以及各种疾病,如痛风、哮喘和慢性肾病。我们将这些代谢物与HCHS/SOL研究中所报道的表型进行了关联,发现了24个显著的代谢物-表型关联,包括8个代谢物-脂质和3个代谢物-血细胞特征。
4. 评估代谢物的组织特异性
为了提高对我们之前未报道的发现的生物学见解,我们评估了代谢物的组织特异性。Pascal分析鉴定出376对具有统计学意义的基因代谢物,其中313对位于具有普遍效应的变异位点,在组织特异性富集分析中,top“one”排列的组织代谢物有9对肝脏代谢物和3对肾脏代谢物。
5. 通路分析
两个蛋白质相互作用网络中排名前十的重要模块有70对基因代谢物,它们包含以前未报告的变异基因位点与广义的效果,其中41对基因代谢物在DAVID模块中,包括三个基因,注解了三个具有普遍效应的变异代谢物。41对基因代谢物中,两种方法在几个相同的途径中选择了两个基因:根据KEGG和BIOCARTA的研究,EEF1A2-胍基乙酸参与代谢过程和转移酶活性的调节,而F12-亮氨酰甘氨酸参与凝血。
6. Locus-Specific调查
代谢产物水平的变化可能反映了体内平衡的变化,可能是潜在的疾病过程;因此,研究确定的变异、各自的代谢物水平和疾病结果之间的关系有助于我们理解后者。有39种代谢物与泛效应的变异相关,其中12种曾被报道与各种健康状况有关,我们检查了代谢物,但它们还没有与疾病相关的证据,例如,一个非同义的变体rs324420 (FAAH)与内源性大麻素N-油基牛磺酸(MAF)水平的增加有关;脂肪酸酰胺水解酶(FAAH)在药物成瘾中起作用(MIM: 606581),这导致我们选择吸烟和饮酒状态作为研究结果,N-油基牛磺酸的每一次SD升高都与3595名HCHS/SOL参与者的当前低吸烟率以及3925名ARIC EAs当前低饮酒率相关,然而,我们没有观察到rs324420与吸烟或饮酒状况之间有统计学意义的关联。
在我们的研究中,内含子变异rs2328895 (SLC17A1)与N-乙酰色氨酸的减少有关,并与之前的GWAS中报告的痛风风险率降低有关。痛风会增加冠心病和HF的风险,因此,我们研究了冠心病和HF的变异和代谢物,在HCHS/SOL参与者和ARIC EAs中,N-乙酰色氨酸水平的每一个SD升高都与流行冠心病的几率增加有关,在ARIC EAs中流行冠心病的几率增加231%,发生HF的风险增加58%。研究显示Rs2328895与ARIC Eas中冠心病发病风险降低有关,其中风险降低作用主要体现在老年人身上(年龄大于60岁)。
7. 孟德尔随机化
除了非遗传观察分析,我们进行了MR分析,阐明了与心脏病(CHD和HF)和糖尿病(T2D)相关的可能因果路径,这两种疾病都是美国十大死亡原因之一。基因调控的5种较高水平的代谢物(比如已知的冠心病和T2D的危险因素),对冠心病和T2D有统计学上显著的因果影响(图5A、5B)。我们估计,十八酸二酯、gamma - CEHC和gamma - CEHC葡萄糖醛酸钠水平的每一个SD升高分别与冠心病发病几率降低17%、16%和23%相关。此外,1-花生四烯甘油酯(20:4)和1-棕榈酰-2-硬脂酰-GPC(16:0/18:0)每一个SD增加均与T2D增加的几率相关。
图5 森林图进行孟德尔随机化分析结果
(A)冠心病。(B) 2型糖尿病
结论
综上所述,我们的研究证明了循环代谢物在一个缺乏代表性的西班牙裔/拉丁裔社区的遗传结构中改进了GWAS位点的功能注释。通过鉴定选定的基因调控代谢产物和疾病结果之间的因果关系,这项研究得到了进一步的结果。我们的结果为基础科学和临床医学的后续研究提供了一个独特的资源和有趣的视角,以进一步阐明疾病的病因。