科研 | 中国科学院:转录组和代谢组变异联合揭示食管鳞癌的发病机制(国人佳作)
编译:孙元芳,编辑:Tracy、江舜尧。
原创微文,欢迎转发转载。
食管鳞状细胞癌(ESCC)是一种侵袭性的恶性肿瘤,在中国每年导致超过25万人死亡。然而ESCC的发病机制尚不清楚,这阻碍了该病的临床诊断和治疗。我们采用转录组和代谢组相结合的综合策略寻找食管癌的潜在致病基因和代谢物,作为食管癌发病的潜在生物标志物。通过转录水平的分析和通路富集分析,我们发现了食管癌患者的异常基因导致酪氨酸代谢途径失调。随后我们通过靶向代谢组学方法对酪氨酸途径的上下游代谢物进行了研究。最终苯丙氨酸、4-羟基苯乳酸、3,4-二羟基苯丙氨酸、3,4-二羟基苯乙酸和酪氨酸5种代谢产物被确定为ESCC和转移性ESCC的诊断生物标志物。我们还建立了一个包含转录和代谢失调的生物学模型来解释食管癌发生和转移的潜在机制,酪氨酸途径主要通过改变免疫应答和调节肿瘤微环境在食管癌的发生和转移中起重要作用。这项研究揭示了食管癌的发病机制,并发现了潜在的诊断该疾病的生物标志物。
论文ID
实验设计
实验结果
1. ESCC患者肿瘤相对于邻近非肿瘤组织的转录组学改变
我们首先从公共数据库中下载了15例中国ESCC患者的肿瘤和邻近非肿瘤组织的RNA测序数据,这些患者的种族、年龄、性别和肿瘤分期与参与血清代谢组学的92例中国ESCC患者相似。差异表达分析发现4868个显著功能失调的基因,其中2814个基因表达上调,2054个基因表达下调(图1A)。前20个调控基因的表达谱如图1B所示,GO和KEGG通路富集分析揭示了这些功能失调基因的功能(图2和3)。上调基因在以下功能和途径中高度富集:(1)细胞成分的组织和定位;(2)刺激和应激反应;(3)细胞间和细胞内信号转导;(4)免疫过程;(5) DNA复制与代谢过程;(6)细胞周期(特别是有丝分裂过程)。下调基因与以下功能和途径有关:(1)细胞形态发生和生物学特性;(2)分解代谢过程和一些复合代谢过程(如脂肪酸、丙酸、苯丙氨酸、组氨酸);(3)胞吐作用和异种生物代谢;(4)参与免疫过程的髓细胞激活;(5)细胞死亡和自噬。这些结果表明肿瘤发生是细胞的额外刺激信号,影响正常的细胞形态发生导致DNA复制、细胞周期、增殖和凋亡的紊乱。
图2 上调基因富集分析气泡图
(A) GO -生物过程和(B) KEGG通路的富集项中分别排在前20位(根据校正后的p值)的功能或通路
图3 下调基因富集分析气泡图
(A) GO -生物过程和(B) KEGG通路的富集项中分别排在前20位(根据校正后的p值)的功能或通路
2. 酪氨酸代谢途径基因的基因集富集分析
途径富集分析表明ESCC下调基因在某些代谢途径中富集,特别是苯丙氨酸-酪氨酸途径(苯丙氨酸是酪氨酸的生物合成前体,图3B)。在这项研究中, 苯丙氨酸-酪氨酸通路被选为进一步研究基于跟踪的利益目标原因:(1) 苯丙氨酸-酪氨酸通路的多个化合物,如苯丙氨酸、多巴胺和去甲肾上腺素被报道与肿瘤发生密切相关,这意味着ESCC的途径可能在肿瘤发生中发挥重要作用;(2)酪氨酸是重要的神经递质,最近被认为是触发肿瘤进展的一种新型因子,因此我们试图在这一新的研究领域揭示ESCC的发病机制。我们对酪氨酸代谢基因进行了基因集富集分析(Gene Set EnrichmentAnalysis, GSEA),以评估这些基因是否与肿瘤状态密切相关。我们将酪氨酸通路基因的表达谱与全人类基因组基因的表达谱进行比较,将肿瘤和非肿瘤情况划分为两种生物学状态(图4)。结果表明与非肿瘤组织相比,参与酪氨酸通路的基因在肿瘤组织中倾向于下调(标准化富集评分(NES)为−1.64,FDR q值为0.011)。这些结果证实了酪氨酸通路相关基因与ESCC的进展显著相关,该通路的代谢物可能在肿瘤发生过程中发挥重要作用。
图4 酪氨酸代谢基因的基因集富集分析
3. ESCC患者与健康对照的代谢物表达谱
我们通过靶向代谢组法进一步探讨了ESCC患者和健康对照组酪氨酸通路相关代谢物的表达量。我们定量检测了九种代谢物,包括苯丙氨酸(PHE),4-羟基苯基乳酸(HPLA),3,4-二羟基苯丙氨酸(DOPA),3,4-二羟基苯乙酸(DOPAC),酪氨酸(TRY),香草醛酸(VMA),高香草酸(HVA),多巴胺和去甲肾上腺素。但由于多巴胺和去甲肾上腺素的质谱信号较弱,我们未对酪氨酸代谢通路的多巴胺和去甲肾上腺素进行进一步评价,而是通过计算与其相应内标的峰面积比来评估7种剩余代谢物的相对丰度。与健康对照相比,所有7种代谢物的表达丰度在ESCC和转移性ESCC患者中都有增加的趋势(图5)。
随后我们进行了差异分析揭示健康对照、ESCC和mESCC患者的标志性代谢物(表1和表2)。值得注意的是四种代谢物(即PHE、HPLA、DOPA和DOPAC)在ESCC和mESCC患者中与健康对照组相比均有显著差异(p < 0.05)。在mESCC患者和健康对照之间TYR也显示了差异表达(p <0.05)。非转移性和转移性ESCC患者的PHE和TYR有统计学差异(表3)。
图5 健康对照、ESCC和转移性ESCC患者中酪氨酸通路代谢物的表达丰度
表1 健康对照组与ESCC患者代谢物丰度的比较
表2 健康对照组和转移性ESCC患者代谢物丰度的比较
表3 非转移性ESCC患者与转移性ESCC患者代谢产物丰度的比较
4. ESCC的诊断与预后模型
logistic回归函数用于ESCC诊断预测,而至于非转移性ESCC患者,诊断模型如下:P = exp.(Int + w1×PHE+ w2×HPLA + w3×DOPA+ w4×DOPAC) / [1 + exp.(Int + w1×PHE + w2××HPLA + w3×DOPA+w4×DOPAC)], P是ESCC的发生概率,Int的拦截模型,w1, w2, w3, w4微分代谢物的表达量。我们采用五交叉验证方法对诊断模型的性能进行检验,以灵敏度、特异性和准确性作为评价指标,该模型的灵敏度、特异度和准确度分别为0.9111、0.8000和0.8714。受试者工作特征(ROC)曲线下面积(area under curve,AUC)为0.8622。我们也建立了转移性ESCC患者的诊断模型,模型定义为P = exp.(Int+w0×TYR+w1×PHE+w2×HPLA+w3×DOPA+w4×DOPAC)/[1+exp.(Int+w0×TYR+w1×PHE+w2×HPLA+w3×DOPA+w4×DOPAC)]。灵敏度、特异度、准确度分别为0.9378、0.8800、0.9172,AUC达到0.9311,这些结果表明,两种诊断模型都能正确地区分ESCC和mESCC患者与健康对照。临床上转移是恶性肿瘤的典型征象,因此我们构建了一个基于代谢物差异将mESCC患者与ESCC患者分类的预后模型。预后模型定义为P = exp.(Int +w0×TYR + w1×PHE)/[1+ exp.(Int + w0×TYR + w1×PHE)]。该模型的敏感性为0.7644,特异性为0.6222,准确性为0.6971,AUC为0.6030,评价结果显示具有较好的预后预测效果。综上所述,酪氨酸代谢途径中的代谢产物可作为预测ESCC肿瘤发生和转移的潜在标志物。
5. 整合转录组和代谢组数据的生物学模型
我们通过主成分分析法评估酪氨酸通路基因具有区分肿瘤组织和正常组织的能力(图6A)。对于酪氨酸代谢的代谢物,我们也用同样的方法检测了它们区分ESCC患者和健康对照组的能力(图6B)。结果表明,酪氨酸代谢相关基因和代谢物均可帮助识别和控制肿瘤,暗示这些基因和代谢物在ESCC的进展中发挥重要作用,酪氨酸代谢可能是其关键通路。因此我们结合转录组学和代谢组学的数据,建立了酪氨酸代谢通路的生物学模型来解释其潜在的机制(图7)。其中一个重要的分支是酪氨酸通过一些重要的化合物转化为高香草酸(HVA),包括3,4-二羟基苯丙氨酸(DOPA)、多巴胺(DA)、3-甲氧基酪胺(3MT)、3-甲氧基-4-羟基苯乙醛(MOPAL)、3,4-二羟基苯乙醛(DOPAL)、3,4-二羟基苯乙酸酯(DOPAC)。我们之所以关注这一分支,是因为酪氨酸、DA、DOPA和DOPAC是重要的神经化学物质,它们被认为是某些神经元疾病和肿瘤的关键因素。苯丙氨酸是酪氨酸生物合成的前体,而高香草酸是酪氨酸的下游代谢产物;有趣的是,与健康对照组相比,该途径的上下游代谢物(即苯丙氨酸、酪氨酸、DOPA、DOPAC和HVA)在ESCC患者中呈上升趋势,此外随着ESCC的转移进展,这些代谢物在一定程度上比健康对照组有更高的从非转移到转移的趋势。在转录组学水平上,该分支的大部分上游催化酶编码基因(IL4I1、TYR、DDC、COMT、AOC2)也表现出增加的趋势,这与代谢组学的改变一致。这些结果证实了酪氨酸代谢基因和代谢物是ESCC进展过程中的重要因素,酪氨酸代谢紊乱与该疾病的肿瘤发生有关。
图6 ESCC患者和健康对照的主成分分析(A)基因和(B)酪氨酸代谢代谢物
图7 酪氨酸代谢过程的生物学模型
对于ESCC患者和健康对照组的比较,上下箭头表示代谢物的表达谱,上下三角形表示基因的特征
讨论
在这项研究中,我们比较了肿瘤和非肿瘤组织的转录谱并鉴定出ESCC中的失调基因。GO和通路富集分析表明,这些失调基因与细胞生理、免疫应答和生物代谢过程显著相关。随着ESCC的发展,正常的细胞形态发生、增殖和凋亡被肿瘤发生破坏,导致DNA复制和细胞周期紊乱,此外细胞的免疫过程也受到严重影响导致淋巴系统紊乱,一些紊乱的代谢过程导致许多重要代谢物的异常积累严重影响细胞行为。
表达基因是遗传信息的上游产物,而表达代谢物是遗传信息的下游产物,因此,基因表达的改变自然会导致肿瘤进展过程中代谢物的改变,转录组学分析表明许多重要的细胞代谢通路在ESCC中被破坏。本文通过靶向代谢组学进一步研究酪氨酸通路的代谢概况确定代谢标志物,建立ESCC进展的生物学模型。我们的数据表明,酪氨酸途径的代谢产物在肿瘤发生和转移过程中发挥重要作用。该途径的一些重要化合物苯丙氨酸、4-羟基苯乳酸、3,4-二羟基苯丙氨酸、3,4-二羟基苯乙酸和酪氨酸可作为潜在的ESCC诊断生物标志物。这些结果证实了靶向代谢组学可以探索特定通路的代谢谱,验证转录的可变性,从而帮助生物学家理解肿瘤发生和转移的机制。
为了阐明ESCC的发病机制,我们结合转录组学和代谢组学失调建立了一个完整的酪氨酸代谢通路生物学模型。首先,肿瘤患者中酪氨酸及其前体苯丙氨酸的表达水平高于正常对照组,L-氨基酸氧化酶(IL4I1基因)能将l -苯丙氨酸分解为苯丙酮酸继而生成酪氨酸。最近IL4I1被报道为一种免疫抑制剂,其高活性与肿瘤发生相关,它参与B细胞和T细胞免疫应答的调节;IL4I1的高表达抑制了B和T细胞的活性导致免疫逃避,从而提供了肿瘤生长的微环境。多巴胺是由酪氨酸通过羟基反应产生的DOPA脱羧生成的,单胺氧化酶A基因(MAOA基因)响应多巴胺的降解,其失调与多巴胺紊乱有关。本研究中在ESCC患者中观察到相关的MAOA和多巴胺的变化,这是一种代谢应激,促进肿瘤细胞增殖,阻止肿瘤细胞凋亡。多巴胺高表达可诱导瓦伯格效应,导致能量代谢重编程,增强肿瘤细胞的侵袭性和转移能力。ALDH3家族被认为是细胞凋亡和自我更新的重要因素,家族成员可以神奇地减少化合物积累诱导的致癌特性。从转录和代谢方面来看,ESCC患者的ALDH3家族酶活性降低,导致细胞自我更新能力较差,细胞癌变倾向较强。
结论
本研究采用转录组和代谢组的综合分析来揭示ESCC的发病机制,ESCC患者的转录和代谢谱揭示酪氨酸通路失调与ESCC的肿瘤发生和转移密切相关。本研究建立的生物学模型提供了对ESCC进展的更深入的理解,并为该疾病提供了有前景的诊断生物标志物。