科研 | 肠道菌群代谢与HIV感染炎症之间的相互作用
本文由谢忠杰编译,董小橙、江舜尧编辑。
原创微文,欢迎转发转载。
HIV感染导致肠道相关淋巴组织的破坏,使得肠道菌群的组成发生变化。但目前还缺乏关于HIV感染如何影响微生物与宿主之间相互作用的研究。本文结合宏基因组和宏转录组数据来研究HIV相关微生物的功能修饰。结果表明,HIV相关微生物一方面很好地适应炎症环境,例如抗氧化应激反应通路的高表达、抗炎反应过程的低表达,另一方面促进肠道炎症的发生发展。本文通过共发生网络和代谢网络,分析了群落结构中物种标记物和代谢标记物的相关性。通过贝叶斯网络,发现了维持群落结构稳定性的关键通路。此外,确定了群落中各物种对代谢活动的贡献,以及各物种和宿主健康的相互作用。
论文ID
原名:Interplay between gut microbiota metabolism and inflammation in HIV infection
译名:炎症性肠病中肠道菌群结构及代谢活动变化
期刊:The ISME Journal
IF:9.520
发表时间:2018年
通信作者:María José Gosalbes、Andrés Moya
通信作者单位:西班牙研究团队
背 景
HIV全称为人类免疫缺陷病毒,为逆转录病毒科、慢性病毒亚科,是造成人类免疫系统缺陷的一种病毒。HIV病毒颗粒呈球形,直径100-120nm,与CD4+受体细胞有亲和力。HIV病毒是二倍体病毒,其基因组由2个相同分子的正链单股RNA组成,病毒内部有逆转录酶、蛋白酶、整合酶。
获得性免疫缺陷综合症是由HIV引起的一种传染性疾病,抗逆转录病毒治疗(ART治疗)的出现大大降低了HIV感染者的发病率和死亡率,但治疗效果在感染人群中有差异:有些患者在ART治疗后1-2年时间免疫系统功能得到一定程度恢复,称为免疫应答者(IR);但有些患者在ART治疗后1-2年时间免疫细胞的功能未得到有效恢复,称为免疫无应答者(INR)。
HIV感染是一个全球性的流行病。HIV侵入并破坏人体的正常免疫系统,导致肠道微环境平衡被破坏,改变肠道菌群组成以及代谢,破坏正常的宿主反应机制。目前,关于研究肠道内微生物菌群变化对HIV感染者健康的影响,已成为一个热门的研究领域。以上为本文研究工作的背景。
材料和方法
2.1 研究队列和临床指标
参考引文[5],本文研究对象为:病毒血症患者12例(VU=12),免疫应答者18例(IR =18),免疫无应答者9例(INR=9),以及未感染HIV的健康对照15例(HIV-=15)。关于肠道炎症、肠道细菌移位、胸腺功能、T细胞活化的生物标记物也在引文[5]中有论述。
2.2 DNA/RNA提取和测序
参考引文[5],本文的测序实验完成于西班牙瓦伦西亚公共卫生研究中心,序列数据文件上传至EBI数据库,编号为PRJEB23871。
2.3 宏数据处理和生信分析
宏数据处理的思路如下:1)针对数据预处理,二代测序产生宏基因组和宏转录组数据,对DNAseq和RNAseq的原始数据去除低质量序列和宿主基因序列等预处理操作。2)针对序列拼接,宏基因组序列拼接使用Ray-Meta工具,宏转录组序列拼接使用Trinity工具,得到叠连群。3)针对基因预测,宏基因组ORF鉴定使用MetaGeneMark工具,宏转录组ORF鉴定使用TransDecoder工具,工具介绍请参考引文[33]。4)针对功能注释,宏基因组和宏转录组的功能注释均使用rapsearch2工具比对KEGG数据库,得到基因家族信息和基因通路信息。5)针对物种注释,宏基因组和宏转录组的物种注释均使用blast工具比对Genomeclustdb数据库。
生信分析的思路如下:1)使用LEfSe方法来识别物种标记物和代谢通路标记物。2)使用广义线性模型GLM,将通路标记物作为响应变量,将物种分布作为预测变量,研究各物种与HIV相关代谢通路之间的相互作用。3)使用hmmsearch和blast工具比对ORFaanr数据库,实现敏感性分析,研究HIV引发炎症有关的代谢途径。4)其他关于生态学、聚类、排序、相关性分析等方法的介绍,请参考本文的补充材料。
2.4 基因表达分析
基因丰度的计算方法:基于宏基因组序列数据,使用soap工具比对ORFaanr数据库,计算各基因片段的丰度,流程请参考引文[37]。转录本丰度的计算方法:基于宏转录组序列数据,使用RSEM工具比对ORFaanr数据库,再根据测序深度和转录本长度,计算各转录本的表达量/丰度,数学单位FPKM。基因表达分析:通过计算各个功能基因的RNA/DNA丰度比值,来定义过表达基因或低表达基因,显著性分析使用t-检验和BH校正,方法请参考引文[15]。
2.5 生态网络和代谢网络
生态网络的构建方法:基于DNAseq和RNAseq的物种注释数据,生态网络中包含平均丰度大于0.01%且出现在70%以上样本的物种。使用SparCC工具计算物种之间的相关性。使用igraph工具编辑共发生网络。代谢网络的构建方法:基于DNAseq和RNAseq的功能注释数据,代谢网络中包含宏基因组显示的通路和宏转录组显示的通路。使用KEGG-graph和igraph工具编辑代谢网络。关于网络拓扑属性,介数、度数、特征向量中心性,网络碎片化等方法的介绍,请参考本文的补充材料。
2.6 多组学贝叶斯网络
基于宏基因组、宏转录组和代谢组数据,使用贝叶斯网络方法来预测T细胞活化、胸腺功能、细菌移位等对菌群的影响。关于马尔可夫毯概念:针对贝叶斯网络中任意一节点,其马尔可夫毯包含了它的所有信息,而非马尔可夫毯被认为是它的冗余信息。
实验结果
3.1 肠道菌群与HIV关联的宏基因组
基于宏基因组数据,参考图1a,NMDS聚类分析结果表明,HIV+组和HIV-组样本中KO基因含量的差异性很大。其差异性同样体现于各个患病HIV+组(VU组、IR组、INR组)和对照HIV-组的比较中。接下来使用LEfSe工具来分析微生物组间差异。参考图1b,发现34个KEGG通路、186个KEGG直系同源基因可能是导致组间差异的基因和通路标记物。例如,HIV+样本菌群表现为促炎症反应通路(ko00540、ko05111、ko05120)的增加,抗氧化应激反应通路(ko00250、ko00908)的增加,而信号转导和膜转运通路的减少。
图 1
微生物组间差异不仅体现在功能方面,物种方面也有所体现。HIV+样本菌群表现为Prevotella、Acidaminococcus、Streptococcus等菌属的增加,而Bacteroides、Bifidobacterium、Akkermansia、Odoribacter、Alistipes等菌属的减少。
3.2 肠道菌群与HIV关联的宏转录组
基于宏转录组数据,参考图3a,NMDS聚类分析结果表明,HIV+组和HIV-组样本中RNA-KO基因含量的差异性很大。接下来使用LEfSe工具来分析微生物组间差异。参考图3b,部分结果如下,HIV+样本菌群表现为应激反应通路(ko04141、ko00521、ko00730、ko00053)的转录本丰度增加,而抗炎症代谢过程(ko00650、ko00640、ko00071)的丰度减少。
图 3
本文计算log RNA/DNA丰度比值,来确定差异表达(过表达或低表达)的基因。结果发现,HIV+组中49.08%的基因差异表达,其中13.89%过表达;而HIV-组中40.61%的基因差异表达,其中11.90%过表达。参考图4,差异表达基因结果表明,HIV+样本菌群表现为应激反应通路(ko00730、ko00521、ko4141)的过表达,而抗炎症代谢通路(ko00640、ko00650)的低表达。因此宿主的局部炎症反应,可能致使微生物优先表达那些减弱氧化应激反应的代谢通路。
图 4
基于宏转录组数据的物种注释结果,HIV+样本菌群表现为Prevotella、Acidaminococcus、Coprobacillus、Streptococcus等菌属的增加。这些被认为是转录活跃细菌。
3.3 肠道菌群与HIV关联的生态失调
使用广义线性模型GLM分析,发现HIV+组中细菌物种标记物与通路标记物为正相关。该方法评价了物种标志物是否携带与其正相关的通路标记物的基因,或者促进具有代谢功能的群落细菌的生长。本文发现物种标志物提供了涉及其相关代谢通路的基因,而且普氏菌属各个菌种都提供了涉及HIV相关通路的基因,表明普氏菌属在HIV发病过程中的重要作用。
3.4 肠道菌群与HIV关联的生态网络和功能网络
共发生网络和代谢网络可以研究群落中生态和功能的相互作用。参考图6a,肠道菌群与HIV关联的共发生网络体现了连通性分布和小世界效应等性质。参考图6b,该网络产生了20个模块,各模块都包含3个以上物种,最大模块包含34个物种。大多数模块的主导细菌为厚壁菌门与拟杆菌门,少数模块的主导细菌为放线菌门和变形菌门。结果还发现,如果模块中包含双歧杆菌属(放线菌门),则该模块中不存在变形菌门,推测放线菌门和变形菌门有竞争关系。
图 6
除了讨论共发生网络,代谢网络也展示了3700种酶和31725条互作关系,结果发现了KO标记物是代谢网络的核心,揭示了其与HIV微生物代谢过程的相关性。
3.5 肠道菌群失调和宿主健康
基于宏基因组、宏转录组、代谢组、临床指标等数据,使用贝叶斯网络来研究肠道菌群失调对HIV免疫发病机理的综合影响。本文贝叶斯网络(临床指标、功能基因)包含190个节点和548条连线。结果发现,代谢相关通路的马尔可夫毯与临床指标有很多联系。参考图7,针对丁酸代谢的马尔可夫毯(丁酸MB),总共包括89个节点,其中16个是临床变量节点,而且与丁酸代谢有直接联系的是炎症(hs-CRP)、细菌移位(BPI)、内皮功能障碍(ADMA)、凝血(D-dimers)等标记物。结果还发现丁酸代谢与丙酸代谢通路(ko00640)呈现正相关,与脂肪酸代谢通路(ko00071)呈现正相关,与Nadir CD4+T细胞数目呈现负相关。结果还发现CD4+T细胞数目与鼠胆酸含量呈现正相关,已知鼠胆酸在HIV患病人群中过量表达。结果还发现,免疫激活标记物例如HLA-DR+CD38+CD4+T细胞、HLA-DR+CD38+CD8+T细胞,与齐墩果烷型三萜代谢物、各种膜结构脂质均呈现明显的负相关。
图 7
讨 论
本文通过解读微生物组学的研究成果,帮助改善临床治疗效果,并且指导新疗法的开发。请参考本文Disscussion部分内容。
评 论
本文作者首先回答了HIV感染后的人体肠道菌群中细菌的种类和细菌参与的代谢过程,其次回答了与HIV疾病关联的细菌种类、基因表达和基因功能,然后使用网络方法研究了肠道微生物群落的内外关系。网络分析具体如下:基于宏组学数据的物种注释信息,可以做生态网络分析;基于宏组学数据的功能注释信息,可以做代谢网络分析;基于宏组学数据、代谢组数据以及临床指标,可以做贝叶斯网络分析。
小编认为感兴趣的读者可以:1)琢磨社交网络/生态网络/生物网络的一般性质;2)使用R/Python/CytoScape软件实现网络的可视化;3)讨论酶的网络图(功能基因的网络图)是否有研究价值。同时欢迎读者朋友与小编反馈意见并讨论想法。
主要参考文献
[ref5] S. Serrano-Villar, et al. The effects of prebiotics on microbial dysbiosis, butyrate production and immunity in HIV-infected subjects. Mucosal Immunol. 2017.
引用内容;样本数据来源(引文作者系西班牙研究团队)。
[ref15] E.A. Franzosa, et al. Relating the metatranscriptome and metagenome of the human gut. PNAS. 2014.
引用内容;转录本丰度的计算方法。
[ref37] H.B. Nielsen et al. Identification and assembly of genomes and genetic elements in complex metagenomic samples without using reference genomes. Nature Biotechnology. 2014.
引用内容:基因丰度的计算方法。
[ref33] B. Hass, et al. TransDecoder (find coding regions within transcripts). 2015.
引用内容:TransDecoder工具(识别转录本序列中的编码区域)。
你可能还喜欢