这种纯生信发文思路值得学习

文章题目:A three-gene signature based on tumour microenvironment predicts overall survival of osteosarcoma in adolescents and young adults

研究背景:

目前尚无明确且临床上适用的骨肉瘤预后指标。因此,本研究有望基于TME相关基因建立新的预测模型,并评估其在评估骨肉瘤结果中的作用,为将来的进一步研究提供参考。

研究方法:

从UCSC Xena网站下载相关TARGET骨肉瘤患者的基因表达谱和临床数据。其中,共有82名25岁以下且存活超过1个月的患者。GSE21257数据库用作验证,包括53位骨肉瘤患者及其临床信息(年龄,性别,组织学亚型和huvos等级,肿瘤位置,诊断转移和生存率)。所有样品均取自原发灶,并通过微阵列检测基因表达谱。验证集GSE21257的表达矩阵数据是从GEO数据库下载的,R包“ limma”用于质量控制和标准化。计算具有多个探针的基因的基因表达值作为探针的平均值。

研究结果:

分析了两组之间的差异表达基因(DEG),得到122个DEG。最后,通过多因素Cox分析从122个DEG中获得了具有最小AIC值的三个基因(COCH,MYOM2和PDE1B)。三基因风险模型(3-GRM)可以从训练(TARGET)和验证(GSE21257)队列中区分高风险患者。此外,建立了包含3-GRM评分的列线图模型并开发了临床特征,其中预测1、3和5年生存率的AUC值分别为0.971、0.853和0.818。此外,在3-GRM高分组中,浸润性免疫细胞的富集度显着降低,免疫相关途径被显着抑制。

研究结论:

总之,该模型可以用作预测青少年和年轻人中骨肉瘤患者的生存的标志。

分析思路:

1、将免疫评分和基质评分分别分为高分组(high)和低分组(low),然后合并生存数据进行生存分析,查看预后价值

2、将分好组(high vs  low)的免疫评分和基质评分合并基因矩阵进行差异分析,得到相关的差异基因,然后将它们的差异基因取交集,得到122个基因,再进行GO、KEGG富集分析

3、将122个基因进行批量单因素cox回归分析,一共筛选32个有显著性的基因,然后用lasso 回归进一步筛选并结合因素的重要性,最后得到3个基因进行多因素Cox回归分析

4、将上述模型得到的风险评分进行生存分析,并且绘制ROC曲线评估模型以及绘制相关的热图

5、将风险评分结合临床因素构建模型,验证风险评分是否具有独立的预后价值,绘制相关的森林图。

6、使用GEO数据验证模型

7、分析风险评分与免疫评分、基质评分、肿瘤浸润免疫细胞的相关性

8、从IMMPORT下载相关的免疫基因,进行差异分析,得到的差异基因来做GO、KEGG富集分析,然后进行免疫相关信号途径的比较

9、风险评分与临床病理特征建模绘制列线图

本文的亮点就是结合研究热点免疫评分进行分析,三个基因的模型都是阳性结果,并且有额外的GEO数据可以验证,这就是优势所在。

(0)

相关推荐