7+多组学免疫分型分析还可以这样做
今天跟大家分享的是2020年6月发表在Mol Ther Nucleic Acids杂志(IF=7.032)上的一篇文章:”Multi-omics Data Analyses Construct TME and Identify the Immune-Related Prognosis Signatures in Human LUAD”。在文章中作者利用基因表达谱计算了LUAD的肿瘤微环境评分,并通过对TCGA-portal的多组学数据探讨了组学特征对免疫相关代谢系统和神经系统的影响。此外,采用基于lasso回归和cox回归的四步策略构建预测模型,为LUAD相关免疫治疗提供新思路。
多组学探讨肺腺癌肿瘤微环境并构建免疫预后相关模型
Multi-Omics data analyses construct tumor microenvironment and identify the immune-related prognosis signatures in human lung adenocarcinoma
一.研究背景
肺癌是近年来世界各国研究人员关注的焦点,其中肺腺癌(LUAD)是最常见的组织学类型。然而LUAD发生和发展的潜在机制仍不清楚。为了深入剖析LUAD的肿瘤微环境并发现更多的预后信息,研究深入探讨了3种表观遗传特征(表达状态、体细胞突变和DNA甲基化)与免疫浸润相关的分析,以期推测这些改变在免疫应答中的潜在作用。
二.结果解读
1. LUAD肿瘤微环境的构建及评分特征分析
为了评估浸润性间质细胞和免疫细胞在LUAD的相关效应,使用ESTIMATE算法评估免疫细胞的浸润水平,并综合推断肿瘤纯度。结果表明,肺腺癌免疫评分与肿瘤大小、远处转移以及肿瘤分期密切相关,而较高的免疫评分与较长的总生存时间显著相关,表明肿瘤浸润性免疫细胞在LUAD中具有更强的临床相关性。因为免疫浸润水平和细胞组成与患者预后密切相关,研究进一步探讨了高低免疫评分两组之间的免疫浸润水平。结果提示,高免疫评分组的记忆B细胞、CD8 T细胞、活化记忆CD4 T细胞、M1巨噬细胞、静息树突状细胞、活化肥大细胞和γ-δT细胞的比例显著增加,而浆细胞、M0巨噬细胞和活化的树突状细胞的比例较小。
图1:LUAD免疫微环境评分特征分析
2. 免疫浸润相关差异基因的鉴定
根据LUAD样本的表达谱来确定高免疫组和低免疫组之间的表达变化,其中差异基因筛选条件为:|log2FC|>1 & FDR<0.05。共筛选出611上调以及164个下调基因,其中29种趋化因子如CXCR4和CCL8被发现在高免疫评分组显著上调。接着对差异基因进行了功能富集,结果提示差异基因与大部分免疫通路相关。
图2:免疫分组相关的基因表达变化
3. 不同免疫浸润水平下体细胞突变差异
在检测到上述转录组变化后,研究进一步探讨了高免疫组和低免疫组之间的突变差异,利用R软件包maftools分析了体细胞突变,包括单核苷酸变异(SNV)、单核苷酸多态性、插入和缺失等。结果表明,在高免疫组和低免疫组队列中,大多数基因组变体都是错义突变(约60%)。此外,在高免疫组和低免疫组中分别检测到64344例和88708例SNV,其中C>a型在高免疫组较常见,而无论SNV的类型如何,低免疫组的突变数均显著高于高免疫组。
图3:免疫分组与突变特征分析
4. 不同免疫浸润水平下的DNA甲基化模式
研究通过ChAMP包标准化流程分析LUAD的450K甲基化芯片,差异甲基化位点筛选条件为:∆Beta>0.15 & FDR<0.05。结果表明,与低免疫组相比,高免疫组共检测到高甲基化位点5647个(97.97%),涉及2386个基因,其中2221个位点位于1687个CpG岛上。相比之下,低甲基化位点仅68个基因,涉及117个(2.03%)位点分布在56个CpG岛上。研究进一步对DMP进行GO富集分析,结果提示它们在细胞分化和发育中的潜在作用。DMPs相关基因的基因集富集分析(GSEA)亦表明,DMPs的高甲基化基因影响肿瘤神经生物学过程(如轴突引导和轴突生成),说明异常甲基化对肿瘤免疫的侵袭性行为是通过对神经通路的识别来实现的。
图4:免疫分组与甲基化特征分析
5. 多组学特征相关的预后模型
研究从上述结果中发现了一些免疫相关的多组学特征的变化,包括表达谱变化、体细胞突变和DNA甲基化。在高免疫组中,共检测到611个上调基因和164个下调基因。在体细胞突变方面,高免疫组和低免疫组分别检测到62和129个突变基因。对于DNA甲基化, 3858DMPs个位于2442个注释基因的区域且存在显著差异。为了从上述特征中识别出免疫相关的预后标记物,研究采用基于lasso回归和Cox比例风险回归的策略,并分别研究了上述三种改变的联合效应和分离效应,以确定哪种模型的性能最好。在联合效应方面首先构建单变量Cox比例风险模型,由337个DEGs,5个突变,217个DMPs组成的特征对患者的总生存时间有显著影响。研究者进一步通过lasso回归筛选变量,在保留52个变量的前提下建立多元Cox比例风险回归模型。由于缺乏来自其他来源的匹配多组学数据,研究将TCGA样本随机分为训练和独立测试。训练模型一致性指数(C-index)为0.839。其次,训练集1年、3年和5年预后平均AUC值分别达到0.871、0.875和0.928。而测试集1年、3年和5年生存期的平均AUC值也达到0.796、0.786和0.777。后续研究也单独对每种类型的组学特征改变进行预测模型构建,结果表明表达谱变化、体细胞突变和差异DNA甲基化的分离模型均不能够提供比联合模型更强大的预测效能。
图5:多组学特征相关的预后模型构建
三.小结:
研究首先利用基因表达谱构建了LUAD的肿瘤微环境并进行免疫评分,根据免疫评分分型后探讨了两组患者的多组学图谱,推测这些变化在免疫应答以及免疫相关代谢中的潜在作用。研究进一步在cox回归模型的基础上,采用多步回归法纳入多组学特征构建预测模型,整体预测性能良好。该文对多组学研究有许多可以借鉴的地方,如在分型后描述三种组学特征差异的全景图,以及纳入三种组学特征构建联合模型/分离模型的比较。本团队深耕组学数据分子分型多年,对上述文章方案有兴趣欢迎共同探讨。
科研风暴团队提供正规、可复现的生信分析
接受预定,名额有限