值得借鉴!公开数据库加点湿实验就发了7分+SCI!
Clinical significance and inflammatory landscapes of a novel recurrence associated immune signature in early-stage lung adenocarcinoma早期肺腺癌复发相关免疫标志物的临床意义与炎症特点
一、背景介绍
肺腺癌(LUAD)占据了肺癌病人的40%,因为早期难以发现且30%-45%的早期发现病人5年内会复发,LUAD恶性程度很高,5年生存率仅为17%,所以找到鉴定出易复发病人的方法,进行对应治疗十分必要。
越来越多证据表明肺癌与免疫密切相关,免疫逃逸机制激活会导致肺癌免疫应答缺失,免疫相关基因可以用于病人预后预测。
二、分析流程
三、结果解读
1.TCGA中早期LUAD基于免疫基因的复发标志物(IBRS)的建立
作者从TCGA, GSE31210与68个冰冻切片中获取了632个无复发的早期LUAD样本,其中从TCGA中获取的338份样本做为训练集,从GSE31210中获取的226例早期LUAD样本序列信息与其相关的临床数据共同构成验证集,对mRNA表达量进行标准化处理,多探针检测的基因表达量取平均值,从AmiGO 2 Web portal中获取免疫相关基因。
作者将LUAD免疫相关基因与对应mRNA表达量匹配,去除其中低表达基因,使用单因素Cox回归分析计算每个免疫相关基因与无复发生存(RFS)的关系,在TCGA数据集中,作者共筛选到了232个与RFS关联的免疫相关基因,1A展示了232个基因的表达水平,1B,1C展示了这些基因的GO功能分析与KEGG通路富集分析结果,基因主要影响了固有免疫与炎症相关信号通路。然后使用LASSO Cox回归模型对基因进行选择,1D为使用100折交叉验证确定确定LASSO 模型微调参数的结果,1E为基因的coefficient随L1norm的变化,作者确定了11个最具预后价值的基因:GFBR1, DYNC1I2, LGR4, THOC1, ADAM10, SERPINB6, CCL20,WNT2B, SLC11A1, MAPT and PSEN1。
图1.早期LUAD预后相关免疫基因的鉴定
为优化模型作者使用了逐步Cox回归模型最终鉴定了9个最具预后价值的基因,结合基因表达量与回归系数得出风险分数:
Risk Value =(0.3987 × DYNC1I2 expression) -(0.5611 × THOC1 expression) + (0.2405 × ADAM10 expression) -(0.6713 × SERPINB6 expression) + (0.1268 × CCL20 expression) -(0.2408 × WNT2B expression) - (0.2255 × SLC11A1 expression) -(0.2034 × MAPT expression) + (0.6942 × PSEN1 expression)
计算出每个病人的风险得分,依据风险得分将TCGA数据集中的病人划分为高低风险组(2A),然后使用 KM生存分析对比两组的RFS时间,2B展示了两组的病人的KM曲线,高风险组复发率显著高于低风险组,2C为IBRS进行预测的ROC曲线,1,3,5年的复发预测AUC分别为0.775, 0.789, 0.789,表明预测准确度较高。2D与2E展示了在stage I 与stage II病人中的风险分组结果,高风险得分均与低RFS相关。
图2.早期LUAD中免疫基因相关复发特征的建立
2.使用GEO数据集进行IBRS的验证
为验证IBRS的预测作用,作者使用GSE31210做验证集,同样依据风险得分将病人划分为高低风险组,高风险组61例,低风险组165例(3A),3B,3C,3D分别为所有病人,stage I 病人与stage II病人的KM生存曲线,除了stage II病人可能因为样本量过少导致p=0.16外,其他组中,低风险组病人PFS均较好。3E为高低风险组病人的OS生存分析,高风险组病人OS显著低于低风险组病人。
图3.IBRS的预测效果验证
3.不同临床亚组中IBRS的验证
作者将TCGA中早期LUAD病人分为三个临床亚组:男/女,超过60岁/不超过60岁,抽烟/不抽烟,结果显示所有亚组中高风险组病人RFS时间均短于低风险组,此外高风险组的OS也低于低风险组。在GSE31210中进行验证,结果一致。然后作者又分析了三种癌肺癌亚型:鳞状型(squamoid)、支气管型(bronchoid),巨型(magnoid)的风险得分,其中支气管型得分最高(p<0.05),将三种亚型也进行高低风险分组,高风险病人RFS时间同样低于低风险组。
4.不同EGFR,KRAS突变状态患者中的IBRS验证
因为之前研究表明EGFR与KRAS在LUAD中易发生突变,且与肿瘤免疫微环境相关,所以作者分析了不同EGFR,KRAS突变状态患者中IBRS的预测作用。首先,作者分析了两基因突变对风险得分的影响,结果表明与EGFR野生型相比,EGFR突变组的低风险病人比例更高。与之相反,KRAS野生型的高风险病人比例更高。在所有突变状态下,高风险组病人的RFS时间与OS均低于低风险组,在GSE31210中进行验证,结果一致。
5.IBRS的炎症与免疫检查点概况
作者使用了一系列免疫相关分析方法获得免疫相关基因标志物与复发风险间联系的机制。首先,作者分析了七组代表炎症情况与免疫应答的metagenes与IBRS的关系,4A展示了 TCGA数据集中metagene的表达情况。然后使用4B的correlogram展示7组metagenes与风险得分间的关系,结果显示风险得分与IgG,interferon, STAT1正相关,与LAC和MHC-II负相关。为验证此结果,在GSE31210中进行相同操作,4C,D分别为GEO数据集中metagene表达情况和metagenes与风险得分间的correlogram,结果显示,风险得分与interferon, STAT1,LAC和MHC-II有关,表明IBRS与interferon和interferon相关信号转导密切相关。IgG与风险得分在GEO中无关可能是由于瘤内免疫异质性造成。
图4.早期LUAD病人中风险得分与炎症活动的关系
因为风险得分与炎症活动密切相关,于是作者分析了不同免疫表型的差异水平,包括免疫细胞浸润与免疫检查点。使用CIBERSORT估算22种免疫细胞的分布,5A,B展示了TCGA与GSE31210中高低风险组免疫细胞水平,高风险组中CD4记忆T细胞与M1型巨噬细胞占比高。5C,D展示了两数据集中30个共刺激/抑制免疫检查点分子表达情况,B7-H3, 4-1BB, OX40L,IDO1四个检查点分子在高风险组高表达。
图5.早期LUAD中风险得分与免疫间的关系
6.在冰冻切片样本中进行IBRS验证
为避免基因序列数据造成的假阳性,作者使用从68例早期LUAD病人中获得了冰冻切片作为独立数据集进行验证,使用TRIzol试剂提取RNA,然后利用 Prime Script™ RT试剂将RNA逆转录为cDNA,对其进行qRT-PCR分析检测9个IBRS基因的表达。表1展示了病人的临床特征。同样计算各个样本的风险得分,将病人分为高低风险组,6A展示了分组情况,6B,C,D展示了高低风险组的RFS差异,6E展示了高低风险组的OS差异,结果表明高风险组的RFS时间与OS均短于低风险组。
为验证IBRS在三个不同数据集中的综合预后价值,作者使用STATA软件进行了预后meta分析,结果显示IBRS是LUAD复发的风险因素(combined HR = 4.13,95% CI = 2.39–7.12 P < 0.0001) ,同时因为在GEO数据中RFS在stage II病人的高低风险分组中无显著差异,所以作者对三个数据集中的stage II病人也进行了预后meta分析,结果证明IBRS与RFS之间的关联有统计学意义 (combined HR = 2.72,95% CI = 1.39–5.30 P = 0.003)。
表1.早期LUAD病人的临床特征
图6.IBRS在68个冰冻切片中的预后预测效果
7.IBRS独立性检验
作者在TCGA数据集中通过多元Cox回归分析确定在排除年龄 ,性别,吸烟,肿瘤分期,淋巴转移,与EGFR和KRAS突变影响下,IBRS是RFS与OS预测的独立风险因子,结果如表2展示。在GSE31210与切片样本中进行检验,同样证明IBRS可以作为RFS与OS的独立预后因子。
表2.TCGA中IBRS与RFS和OS关联的单因素与多元Cox回归分析
小结
作者使用多个数据集确定了9个与早期LUAD病人RFS和OS相关的IBRS,使用相关基因表达量得出风险得分,风险得分在不同数据集与临床分组病人中均具有预后价值。然后作者将标志物与炎症情况相关联,寻找IBRS与肿瘤复发相关联的机制,最后通过多因素回归分析检验了IBRS的独立性。