科研│ 浙江大学医学院 : 早期类风湿关节炎特异性潜在生物标志物:血液/免疫系统特异性表达的基因(国人佳作)
编译:伊安,编辑:景行、江舜尧。
原创微文,欢迎转发转载。
类风湿性关节炎(RA)是最常见的慢性自身免疫性结缔组织疾病。然而,由于缺乏有效的生物标志物,早期类风湿关节炎很难诊断。本研究旨在通过基因芯片和生物信息学分析相结合的方法,在转录组测序水平上识别RA疾病进展新的生物标志物,探索调控早期RA疾病进展的发病机制。研究人员从GEO数据库下载RA和骨关节炎(OA)患者滑膜组织微阵列数据集(GSE77298和GSE82107),通过R软件鉴定出275个差异表达基因(DEG);通过BioGPS识别出71个特异性表达基因;GO和KEGG富集分析表明DEG主要富集在免疫应答、免疫相关的生物学过程、免疫系统和细胞因子信号通路等方面;通过Cytoscape构建PPI,鉴定出15个hub基因和模块;GEO数据集验证了8个血液/免疫系统特异性表达hub基因。GZMA、PRC1和TTK可能是诊断早期RA的潜在生物标志物。NEAT1-miR-212-3p / miR-132-3p/miR-129-5p-TTK、XIST-miR-25-3p / miR-129-5p-GZMA、TTK_hsa_ circ_0077158-miR-212-3p / miR-132-3p / miR-129-5p-TTK可能是调控早期RA疾病进展的潜在RNA调控通路。
论文ID
原名:Three hematologic/immune system-specific expressed genes are considered as the potential biomarkers for the diagnosis of early rheumatoid arthritis through bioinformatics analysis
译名:早期类风湿关节炎特异性潜在生物标志物:血液/免疫系统特异性表达的基因
期刊:Journal of Translational Medicine
IF:4.124
发表时间:2021年1月
通讯作者:吴华香
通讯作者单位:浙江大学医学院
DOI号:10.1186/s12967-020-02689-y
实验设计
结果
1 筛选DEG
研究人员对包含16个RA和10个OA患者样本的GSE77298和GSE82107两个数据集进行分析和识别。与OA样本中的基因比较,研究人员在RA样本中共鉴定出275个DEG,其中包括197个下调基因和78个上调基因。接下来,通过热图和火山图对DEG进行可视化分析,如图1a,b所示。
图1.DEGs。a:RA和OA样本之间的DEG热图,红色代表高表达,绿色代表低表达;b:RA和OA样本之间的DEG火山图,红色的代表上调的基因,黑色的代表不显著的基因,绿色的代表下调的基因。
2 主要组织/器官特异性表达基因的鉴定
研究人员通过BioGPS共鉴定了71个组织/器官特异性表达基因(表1)。这些基因大部分在血液/免疫系统中特异表达(35/71,49.29%),第二个器官特异性表达系统是神经系统,包含13个基因(13/71,18.31%);其次为消化系统(7/71,9.86%)、呼吸系统(4/71,5.63%)、循环系统(4/71,5.63%)、血小板(3/71,4.22%)。最后,内分泌系统、生殖系统以及舌、前列腺和脂肪组织的特异性表达基因最低(1/71,1.41%)。
表1.组织/器官特异性表达基因。
3 富集分析
研究人员通过GSEA软件、R软件clusterProfiler Package和在线工具Kobas 3.0进行功能和信号通路富集分析。首先,将RA和OA患者样本中所有基因的表达谱上传到GSEA,并使用c5:GO基因集在总体水平上对表达谱进行GO富集分析。显著基因组的筛选标准为p<0.05和q<0.25。大多数基因集与先天免疫细胞介导的免疫反应、免疫相关的生物学过程和信号通路有关(图2)。
接下来,使用R软件clusterProfiler软件包和Kobas 3.0分别对DEGs进行GO、KEGG信号通路和Reactome富集分析。DEGs的GO富集分析表明,RA样本的免疫应答比OA样本更强,这包括对体液免疫反应、补体激活、白细胞激活和迁移的调节。根据Q值<0.05选择了前10个生物过程,并以和弦曲线图绘制(图3a)。KEGG信号通路富集分析表明,DEGs富集信号通路包括细胞因子-细胞因子受体相互作用、原发免疫缺陷、JAK-STAT信号通路、FcγR介导的吞噬作用和神经活性配体-受体相互作用。Reactome富集分析表明DEGs主要集中在免疫系统和信号转导,根据Q值<0.05研究人员选择了前五个KEGG通路和前五个Reactome (图3b)。
图2.GSEA显示RA组和OA组免疫相关基因富集最多。a:最显著的免疫相关基因集是调节自然杀伤细胞介导的免疫(ES = 0.666, NES = 1.615, p < 0.05);b:第二个显著丰富的免疫相关基因集是对自然杀伤细胞药物免疫的正调节(ES=0.729,NES=1.604,P<0.05);c:第三个显著丰富的免疫相关基因集是参与免疫反应的细胞因子产生的负调控(ES=0.553,NES=1.603,P<0.05);d:第四个显著丰富的免疫相关基因集是对自然杀伤细胞介导的细胞毒作用的正调节(ES=0.766,NES=1.600,P<0.05);e:第五个显著丰富的免疫相关基因集是单核细胞趋化正调控(ES=0.712,NES=1.510,P<0.0 5);f:第六个显著丰富的免疫相关基因集是抗原受体介导的信号通路的正调控(ES=0.750,NES=1.489,P<0.05)。
图3.GO, KEGG 和Reactome富集分析。a:和弦曲线图显示DEGs前10个富集的生物过程: RA患者滑膜DEGs主要激活白细胞、淋巴细胞等免疫细胞和补体系统,b:气泡图显示DEGs KEGG 和Reactome富集分析最重要的KEGG通路涉及细胞因子及其信号通路,而最重要的Reactome涉及免疫系统和信号转导。
4 PPI网络分析、MCODE聚类以及hub基因鉴定
由DEGs编码的蛋白之间的相互作用网络由187个节点和307条边组成(图4a)。MCODE插件进行模块筛选,cluster 1具有最高得分(得分:9,9个节点和36条边),其次是cluster 2(得分:5.167,13个节点和31条边),cluster 3(得分:3.333,4个节点和5条边),以及cluster 4(得分:2.8,6个节点和7条边)。接下来,研究人员使用cytoHubba plugin识别hub基因,通过Degree、MCC、MNC、DMNC和聚类系数等确定了15个hub基因。这些hub基因是PPI网络中最重要的基因,可能在RA的发病机制中起重要作用。GO和KEGG富集分析表明,DEGs主要富集在免疫相关的生物过程和信号通路,RA作为最常见的自身免疫性疾病,深入了解其免疫相关机制是当前研究的重要内容。RA滑膜中免疫系统特异性表达基因的发现可能有助于发现RA发病机制中关键靶点。因此,研究人员将15个hub基因和血液/免疫系统中特异表达的基因进行分析,最终获得8个血液/免疫系统特异性表达的hub基因,包括CD52、CD27、TTK、GZMA、DLGAP5、PRC1、CEP55和CXCL13(表2)。
图4.DEGs的PPI网络和四个集群模块。a:DEGs编码的蛋白间的相互作用网络由187个节点和307个边组成。每个节点代表一个蛋白,而每条边代表一个蛋白-蛋白关联。红色菱形代表上调,绿色六边形代表下调。Q值越小,形状尺寸越大。集群1(b)具有最高的集群得分(得分:9,9个节点和36条边),其次是集群2(c)(得分:5.167,13个节点和31条边),集群3(d)(得分:3.333,4个节点和5条边),以及集群4(d)(得分:2.8,6个节点和7条边)。
表2.15个hub基因。
5 靶基因miRNAs的预测及共表达网络的构建
研究人员使用五个在线miRNA数据库来预测hub基因的靶miRNA。最后获得了8个hub基因的95个靶miRNA,并确定了105个mRNA-miRNA靶向互作对。根据预测结果,用Cytoscape构建了一个由103个节点和105条边组成的mRNAs和miRNAs共表达网络(图5)。
图5.由mRNAs和靶miRNAs组成的共表达网络。用Cytoscape构建了包含103个节点和105条边的mRNA-miRNA共表达网络。PRC1具有最多的靶miRNAs(37个),而CD52只有2个靶miRNAs。一个节点代表一个mRNA或miRNA,而另一个边代表mRNA和miRNA的一种相互作用。红色菱形代表hub基因,蓝色圆圈代表miRNA。
6 GEO数据库验证8个特异性表达的hub基因
研究人员选取3个GPL96数据集GSE55584、GSE55457、GSE55235,包括33个RA样本和26个OA样本;选取GPL11154、GSE89408数据集,包括57个早期RA样本、95个已确诊的RA样本和22个OA样本,对8个特异性表达hub基因进行验证。用R软件ggplot2软件包和ggpubr软件包绘制箱线图,进行t检验统计分析。RA样本中8个特异性表达hub基因的mRNA表达水平显著高于OA样本(P<0.01)(图6a,b)。此外,还观察到57例早期RA患者GZMA、PRC1和TTK的mRNA表达水平明显高于95例已确诊的RA患者(p<0.05)(图6b)。
图6.GEO数据库验证8个特异性表达的hub基因。a:利用GSE55584、GSE55457和GSE55235三个GPL96数据集进行了验证,与OA组比较,RA组hub基因上调,差异有统计学意义;b:通过GPL11154 GSE89408数据集进行验证。***:P<0.001,**:P<0.0 1,*:P<0.0 5,ns:无显著性差异,与OA组比较,RA组hub基因均上调,差异有统计学意义。与已确诊RA样本相比,GZMA、PRC1和TTK在早期RA样本中表达上调,而其他指标无显著性差异。
7 特异性表达hub基因ROC曲线
研究人员使用IBM SPSS Statistics 25分析OA样本、早期RA样本、确诊RA样本中8个hub基因的表达并绘制ROC曲线。与OA样本相比,这8个特异性表达的hub基因在早期RA样本和已确诊的RA样本中均具有较高的诊断价值。其中,GZMA在早期RA样本中的诊断价值最高(AUC:0.906),而CXCL13在已确诊RA样本中的诊断价值最高(AUC:0.900)。其他基因的诊断价值如下:在早期RA样本中,CXCL13(AUC:0.893)、CD27(AUC:0.872)、CD52(AUC:0.863)、DLGAP5(AUC:0.810)、PrC1(AUC:0.809)、CEP55(AUC:0.805)、TTK(AUC:0.793)(图7a);在已确诊RA样本中,GZMA(AUC: 0.852), CD27 (AUC: 0.817), CD52 (AUC: 0.837),DLGAP5 (AUC: 0.786), PRC1 (AUC: 0.703), CEP55(AUC: 0.731), TTK (AUC: 0.726) (图7b)。由于它们在早期RA和已确诊RA中都具有良好的诊断性能,研究人员结合这些基因在早期RA和已确诊RA中的表达水平,确定对RA具有诊断意义的更好的生物标志物。与已确诊RA相比,GZMA、PRC1和TTK在早期RA中表达上调,有统计学意义(图6b)。因此,研究人员推测GZMA、PRC1和TTK可能是早期诊断RA的生物标志物。
图7.8个特异性表达hub基因ROC曲线。a:8个特异性表达的hub基因在早期RA中的ROC曲线,b:8个特异性表达的hub基因在已确诊RA中的ROC曲线。
8 靶向LncRNA的预测与ceRNA网络的构建
众所周知,miRNAs通过结合mRNAs诱导基因沉默和下调基因表达。然而,其上游分子circRNAs和lncRNAs可以通过结合miRNA反应元件影响miRNA的功能,从而上调基因表达,RNA之间的这种相互作用被称为CeRNA网络。接下来研究人员使用在线数据库Starbase 3.0来预测miRNAs相互作用的lncRNAs和circRNAs,获得PRC1的3个靶lncRNAs和4个靶circRNAs,GZMA的1个靶lncRNAs和19个靶circRNAs,TTK的1个靶lncRNAs和14个靶circRNAs。Cytoscape构建了三个ceRNA网络,如图8a-c所示。随后,研究人员根据ceRNA假说进行文献检索,选取了4个已报道的RA中下调的miRNAs和上调的lncRNA,以及在另一种自身免疫性疾病干燥综合征中上调的lncRNA进行进一步分析。研究人员认为NEAT1-miR-212-3p/miR-132-3p/miR-129-5p-TTK(图8d)和XIST-miR-25-3p/miR-129-5p-GZMA(图8e)可能是调控早期RA疾病进展的潜在RNA调控途径。另外研究人员发现一个由TTK靶miRNA预测的circRNA (TTK_hsa_circ_0077158),其靶标是TTK。因此,研究人员提出了以下circRNA-miRNA-mRNA通路: TTK_ hsa_circ_0077158-miR-212-3p / miR-132-3p/miR-129-5p-TTK(图8f);这可能是早期RA发病机制的关键调控途径。
图8.PRC1、TTK和GZMA三个ceRNA网络及其潜在的RNA调控途径。a:PRC1潜在ceRNA网络,b:TTK潜在ceRNA网络,c:GZMA潜在ceRNA网络,d: NEAT1-miR-212-3p / miR-132-3p / miR-129-5p-TTK,e:XIST-miR-25-3p / miR-129-5p-GZMA,f:TTK_ hsa_circ_0077158-miR-212-3p / miR-132-3p/miR-129-5p- TTK,红色菱形代表hub基因,蓝色圆圈代表miRNA,黄色三角形代表lncRNA,V代表circRNA。
讨论
RA的主要特征是慢性滑膜炎症,甚至会导致关节侵蚀和损害。RA的早期诊断和治疗可有效预防关节损害,提高生活质量。然而,由于缺乏有效的生物标志物,早期RA很难诊断。寻找新的有效的生物标志物对RA的早期诊断和治疗至关重要。
在本研究中,研究人员通过比较RA和OA样本中表达的基因,确定了275个DEG,其中包括71个组织/器官特异性表达的基因。GO富集分析表明,RA患者的免疫反应(如免疫细胞介导的免疫反应和体液免疫反应的调节)均强于OA患者。KEGG通路分析表明这些基因主要富集在细胞因子-细胞因子受体相互作用、原发免疫缺陷、JAK-STAT信号通路、FcγR介导的吞噬作用和神经活性配体-受体相互作用等信号通路。Reactome富集分析DEGs主要富集在免疫系统和信号转导。GO, KEGG 和Reactome富集分析均显示RA患者滑膜具有较强的免疫激活和信号转导。
在使用GEO数据集验证PPI网络筛选的hub基因后,研究人员鉴定出8个血液/免疫系统特异性表达基因。ROC曲线分析表明这些基因对早期和已确诊RA中均有较高的诊断价值。分析GZMA、PRC1和TTK在早期RA和已确诊RA患者中的表达水平,GZMA、PRC1和TTK在早期RA中表达上调,差异有统计学意义(P<0.05)。
GZMA是丝氨酸蛋白酶家族的成员,由细胞毒T细胞和自然杀伤细胞(NK)等分泌,在细胞死亡、细胞因子加工和炎症反应中发挥重要作用。一些研究报道,与OA患者GZMA的表达水平相比,RA患者的血浆、滑膜组织和滑膜中GZMA的表达水平升高,GZMA在RA发病机制中起重要作用。与该研究一致,GZMA在RA的滑膜中表达上调,尤其是在早期RA患者样本中。另外,GZMA的ROC曲线显示,它对早期RA有很高的诊断价值(AUC=0.906)。因此研究人员认为GZMA是诊断早期RA非常有效的生物标志物。
PRC1(也称为ASE1)是一种有丝分裂纺锤体相关的CDK底物蛋白,是细胞分裂的关键调节因子。BioGPS显示PRC1在早期红细胞、内皮细胞和B淋巴细胞中特异表达。目前,PRC1在RA相关研究中尚未见报道。然而,在此次研究中,PRC1在RA的滑膜中表达上调,特别是在早期RA样本中。与OA相比,RA的滑膜炎症和增生更为明显。此外,有报道称滑膜的代谢水平升高,与肿瘤组织的代谢水平相似。这些结果在一定程度上反映了RA滑膜细胞如滑膜成纤维细胞和巨噬细胞的增殖现象,因此,PRC1可能在RA滑膜细胞增殖和疾病进展中起重要作用。
TTK(也称为Mps1和CT96)编码一种双特异性蛋白激酶,可磷酸化多种氨基酸,如酪氨酸和丝氨酸,与细胞增殖有关。与PRC1相似,TTK在早期的红细胞和内皮细胞中也高度特异表达。H Ah-Kim等人研究表明肿瘤坏死因子-α(TNF-α)可增加人关节软骨细胞中TTK的表达,这表明TTK在某些生物学过程中受TNF-α调节。因此,研究人员推测TTK在滑膜细胞增殖和TNF-α介导的RA发病机制中起重要作用。此外,研究人员还发现TTK在RA滑膜中高表达,在RA早期具有较高的诊断价值(AUC=0.793)。因此研究人员认为TTK是诊断早期RA的一种新的、有效的生物标志物。
此外,还预测了GZMA、PRC1和TTK的靶miRNAs、lncRNAs和circRNAs,并用Cytoscape构建了ceRNA网络。在GZMA、PRC1和TTK的靶miRNAs中,以下miRNAs在RA中表达下调:miR-129-5p(在RA滑膜组织和滑膜成纤维细胞中)、miR-132-3p(在RA滑膜成纤维细胞中)、miR-212-3p(在RA滑膜组织和滑膜成纤维细胞中)和miR-25-3p(在外周血单核细胞中)。此外,有报道称lncRNA NEAT1在RA患者外周血单个核细胞中表达上调,因此,研究人员认为NEAT1-miR-212-3p /miR-132-3p/miR-129-5p-TTK可能是调节早期RA疾病进展的一个潜在调控途径。此外,尽管lncRNA XIST在RA中没有报道,但据报道它在另一种自身免疫性疾病-干燥综合征中表达上调。研究人员推测XIST-miR-25-3p/miR-129-5p-GZMA在RA中有重要的调控作用。从circRNAs预测结果来看,研究人员发现一个TTK靶miRNAs预测的circRNA (TTK_hsa_circ_0077158),其靶基因为TTK。因此,研究人员提出一条可能是可能在早期RA发病机制中起关键调控作用的circRNA-miRNA-mRNA通路:TTK_hsa_circ_0077158-miR-212-3p / miR-132-3p/miR-129-5p-TTK。
结论
在本研究中,确定了三个血液/免疫系统特异性表达基因,GZMA, PRC1和TTK,作为RA早期诊断和治疗的潜在生物标志物,并在转录组水平上为RA疾病发展机制提供了见解。此外,NEAT1-miR-212-3p/miR-132-3p/miR-129-5p-TTK、XIST-miR-25-3p/miR-129-5p-GZMA、TTK_hsa_ circ_0077158- miR-212-3p/miR-132-3p/miR-129-5p-TTK可能是调控早期RA疾病进展的潜在RNA调控通路。
更多推荐
1 科研│Int J Mol Sci : 全基因表达分析小鼠创伤后骨关节炎发展中膝关节转录组的年龄相关差异
END