非肿瘤纯生信:STAT1和结核感染的机制挖掘

在上一篇理茶德给大伙带来的非肿瘤生信分析开车指导 (非肿瘤生信分析:来不及解释了快上车!) 后,这次由虾饺皇来给大家带来一篇非肿瘤生信数据挖掘文章分析啦!此外,我们近期会推出20期左右的非肿瘤生信数据分析给大家作为参考。

今天给大家带来的是2020年3月发表在J. Cell. Mol. Med.(4.658)杂志上的文章“STAT1 and its related molecules as potential biomarkers in Mycobacterium tuberculosis infection ”。这篇文章中作者通过分析肺结核队列GSE83456的表达数据,筛选出192个表达差异基因,进而通过进行富集分析表明这些干扰素信号传导途径,并且与防御反应有关。随后,作者进行miRNA预测,绘制miRNA网络,并使用qRT-PCR验证了两个靶基因为STAT1的miRNA,最后作者预测了这两个miRNA的circRNA。

STAT1 and its related molecules as potential biomarkers in Mycobacterium tuberculosis infectionSTAT1及其相关分子可作为结核分枝杆菌感染的潜在生物标志物

一.研究背景

结核病(TB)是一种慢性传染病,其临床表现为长期低烧,咳痰和咯血,其致病菌为结核分枝杆菌(MTB),其中最常见的感染类型为肺结核(PTB),同时MTB还可以感染肠管、淋巴腺、关节、脊柱、泌尿生殖系统和其他器官或组织,导致人替功能障碍和器官组织损伤。结核病的发生、发展和结局不仅与细菌的毒性和数量,还与人体的免疫功能密切相关。人体抗结核免疫主要是细胞免疫,其中细胞因子与各类免疫细胞亚型在免疫防御起关键作用。此外,MTB可以阻碍氧化应激,细胞凋亡和自噬,并抑制组织相容性复合物分子的合成,从而影响抗原呈递。

二.分析流程

三.结果解读

1.样品信息处理和表达差异基因的筛选
  • 图1:对GSE83456数据库(排除免疫抑制性疾病的45例PTB样品和61例健康样品)的表达数据进行分析,筛选出192个表达差异基因,其中156个上调基因和36个下调基因。

图1. 表达差异基因的筛选

2.表达差异基因主要富集于主要在干扰素(INF)信号通路和免疫应答
  • 图2:GSEA分析显示PTB样本在干扰素-α/γ反应和免疫相关的功能中显著富集。

图2. GSEA分析表达差异基因

  • 图3A:对192个表达差异基因进行GO富集分析,表明PTB样品中表达差异基因主要与干扰素信号通路和免疫应答有关,其中显著富集是I型干扰素信号通路

  • 图3B:ClueGO分析生物过程的相互作用网络,并使用Cytoscape ClueGo插件可视化。

图3. GO分析与生物过程的相互作用网络

  • 图4:使用Funrich软件进行富集分析,其中有163个基因用于进一步分析,表达差异基因主要富集于干扰素信号传导通路和免疫相关通路。

图4. Funrich富集分析

  • 图5:使用IPA对192个表达差异基因进行核心分析,有干扰素信号通路、模式识别受体在细菌和病毒识别中作用、被胞质模式识别受体激活的IRF、抑瘤素M信号、TREM1信号、死亡受体信号、神经炎症信号通路和和T细胞衰竭信号通路被激活。其中干扰素通路激活分数最高,其中STAT1、MX1、OAS1、SOCS1、STAT2、TAP1、IFI6、 IFI35、IFIT1、IFIT3、IFITM1、IFITM3、ISG15和JAK2与该通路相关。

图5. IPA核心分析

  • 图6:IPA的生物学功能分析展示了差异基因与炎症、抗病毒应答、免疫应答、活化、抗微生物应答、吞噬作用、趋化性、细胞运动、先天免疫应答和应答功能模块有关。其中具体的模块为细胞吞噬作用的免疫应答、巨噬细胞的免疫应答、抗病毒应答和先天免疫应答,被抑制的模块为大脑的免疫反应和脑炎。同时,进行上游分析,其中排名前五的调节物为转录调节因子:STAT1、IRF7和细胞因子:IFNL1、IFNG、IFNA2

图6. IPA生物学功能分析

  • 小结:作者使用GSEA分析、GO富集分析、Funrich富集分析、IPA核心分析与生物学功能分析证明了PTB样品中的表达差异基因主要富集于干扰素(INF)信号通路和免疫应答。

3.构建蛋白质-蛋白质相互作用(PPI)网络进一步挖掘免疫相关基因
  • 图7:构建192个表达差异基因的PPI网络,有170个基因和1121种相互作用关系,不同颜色代表使用被MCODE识别的不同基因簇,黄色得分最高。

图7. PPI网络

  • 表3:对得分最高的基因簇(图7黄色)进行BP富集分析,发现该基因簇主要为防御反应和免疫系统相关功能的基因。

表3. BP富集分析MCODE得分最高基因簇

  • 图8A:使用STRING对得分最高的基因簇进行分析,所有基因主要与对病毒的防御反应、干扰素信号传导、干扰素α/β信号、细胞因子信号以及免疫系统相关通路有关。其中红色表示与干扰素信号相关;蓝色表示与干扰素α/β信号相关;绿色表示与免疫系统中细胞因子信号相关;黄色表示与干扰素-γ信号转导相关。

  • 图8B:使用Network Analyst验证,并且得到的基因于STRING上的基因取交集得到23个基因用于进一步分析。

图8. STRING和Network Analyst分析

4.miRNA挖掘
  • 图9:作者筛选出28个与细胞因子信号相关基因进行了gene-miRNA分析,作者使用了TargetScan、miRanda、miRDB、miRWalk和RNA22数据库预测miRNA,并且得到的结果取交集作为预测结果,并且使用Cytoscape绘制miRNA的基因的相互作用网络,并且筛选出有两个靶基因的9个miRNA进行进一步验证。

图9. miRNA网络

5.qRT-PCR验证潜在的生物标志物表达
  • 图10:qRT-PCR验证,展示了两个靶基因为STAT1为的miRNA(miR-223-3p和miR-448)在结核病患者血浆中明显低于健康人的血浆。

图10. qRT-PCR验证miRNA

6.circRNA预测

使用StarBase预测hsa-miR-223-3p和hsa-miR-448的相应circRNA,得到两个circRNA:SAMD8_ hsa_circRNA994和TWF1_hsa-circRNA9897。

最后小结一下,作者对肺结核队列的表达数据进行分析,并筛选出总共192个表达差异基因使用GO分析、GSEA分析、Funrich富集分析、IPA核心分析与生物学功能分析等方法确定这些基因大多数都富集于干扰素信号传导途径,并且与防御反应有关。随后,作者使用TargetScan、miRanda、miRDB、miRWalk和RNA22数据库预测miRNA,进而进行qRT-PCR验证,筛选出靶基因为STAT1的miRNA(hsa-miR-448和hsa-miR-223-3p)它们在肺结核患者血浆中下调,最后作者使用StarBase预测了相应circRNA。

(0)

相关推荐