非肿瘤单基因如何做免疫浸润?

GRB10 and E2F3 as Diagnostic Markers of Osteoarthritis and Their Correlation with Immune Infiltration
GRB10和E2F3是骨关节炎的诊断标志分子并与免疫浸润相关

一. 研究背景

骨关节炎(Osteoarthritis,OA)是一种常见的关节疾病。医生通常经过临床诊断和图像技术判断患者是否患有OA,故而医生不能在OA早期做出诊断。故作者希望通过生信技术寻找OA的标志分子,建立OA早期的确诊手段,改善OA患者的诊断情况

二. 研究思路

三. 结果解读

1. 数据处理移除批次效应

作者合并了GSE55235和GSE55457两个数据集的表达矩阵,并用SVA包中的ComBat去除两个数据集间的批次效应。并给出Q-Q图以及去除批次效应前后的PCA分析图验证。

  • 图1:右侧给出正态Q-Q图以及负伽马Q-Q图。说明两个数据集间的批次效应被消除

图1. Q-Q图

  • 图2:A为移除批次效应前,因为批次效应的存在,两个数据集中的正常样本,OA样本明显分开,存在差异。B为处理批次效应后,只有正常样本和OA样本分隔开,而不同批次的样本间没分开,说明批次效应被移除

图2. 移除批次效应前后的PCA分析图

2. 差异表达分析识别DEGs
  • 图3:作者用limma包在OA与正常对照组间进行差异表达分析,DEGs(差异表达基因)的筛选条件是p<0.05,|logFC|>1。共识别出DEGs458个,图中红色表示表达上调,绿色表示表达下调

图3. 差异表达分析得到的火山图

3. 对DEGs进行功能富集分析

针对上文中筛选出的DEGs,作者用clusterProfiler包进行GO,DO以及GSEA分析

  • A:GO分析结果,白细胞转移,外界刺激应答等功能在DEGs中富集

  • B:DO分析结果,慢性淋巴细胞白血病,骨关节炎OA等疾病在DEGs中富集

图4. GO和DO分析结果

  • 图5:两个与免疫相关的通路在OA中富集,分别是PD1信号通路,ZAP-70向免疫突触转位信号通路。图中标出了通路中几个重要的人白细胞抗原(HLA-DPA1,HLA-DQA1,HLA-DPB1等),说明免疫应答在OA中起着重要作用

图5. GSEA分析结果

4. LASSO回归模型以及SVM-RFE识别OA标志分子
  • A:作者通过LASSO回归预测模型从DEGs中识别出14个标志分子

  • B:作者通过SVM-RFE(支持向量机递归特征消除)的算法,以样本DEGs的表达量作为输入,发现在特征基因数量位7时有最高的准确率(Accuracy=0.975)

  • C:将A和B中的标志分子取交集,最后得到GRB10和E2F3作为OA的标志分子

  • D:取数据集GSE51588与前两个数据集合并为一个作为验证集,用ROC曲线法检验两个标志分子的预测能力,AUC(曲线下的面积)接近于1,说明两个OA标志分子可靠

图6. 识别OA标志分子

5. 免疫细胞浸润的结果
  • A:作者用CIBERSORT算法评估了自己整和的芯片数据中的免疫细胞浸润情况,并得到22种免疫细胞的丰度值。通过PCA分析,发现OA和对照组的免疫细胞浸润情况有差异

  • B:相关性热图展示了OA中22种免疫细胞的相关性,作者对其中高度相关的免疫细胞做了说明

  • C:小提琴图展示22种免疫细胞特征基因在OA和对照组间表达差异(红色表示OA,蓝色表示正常对照)。横坐标轴中红色标记了在OA和对照组中存在显著差异的免疫细胞

图7.免疫细胞浸润的结果

6. 分析GRB10,E2F3与浸润免疫细胞的相关性
  • A:分析OA中GRB10的表达量与22种免疫细浸润胞的特征基因表达量相关性

  • B:分析OA中国E2F3的表达量与22种免疫细浸润胞的特征基因表达量相关性

图8. 分析两个OA标志分子与免疫浸润细胞的相关性

小结

本文用生信手段挖掘GEO数据库中OA相关数据集,先合并两个数据集消除批次效应从而扩大样本量,接着经差异表达分析找到DEGs并进行功能富集分析。针对DEGs用LASSO回归模型和SVM-REF两种分类法寻找OA标志分子。最后作者用CIBERSORT算法分析了OA中22种免疫细胞浸润情况,并分析与两个标志分子的相关性。本文的工作量不多,思路也很简单,值得我们学习!

(0)

相关推荐