科研 | Gut Microbes:宏基因组分析揭示了健康和疾病人群不同的优势肠道乳酸菌,丰度和地理差异
编译:流年梦,编辑:小菌菌、江舜尧。
原创微文,欢迎转发转载。
Lactobacillus被广泛应用于食品发酵和生物工业中。一些物种被在食品和肠道样本中分离并作为了益生菌。但是Lactobacillus在食品、肠道和环境生境中的定殖分布并不清楚。该研究收集了6154名受试者的粪便宏基因组数据,涵盖多个国家、地区以及个体特征(年龄、性别、疾病、身体参数等),阐明了Lactobacillus的地理分布特征、组成特征以及与个体特征的关联。
论文ID
原名:Metagenomic analysis reveals distinct patterns of gut lactobacillus prevalence, abundance, and geographical variation in health and disease
译名:宏基因组分析揭示了健康和疾病人群不同的优势肠道乳酸菌,丰度和地理差异
期刊:Gut Microbes
IF:7.74
发表时间:2020.9
通讯作者:Paul W. O’Toole
作者单位:微生物学院和APC微生物组,科克,爱尔兰(英国)
实验设计
结果
1. 人类肠道Lactobacillus的分布以及基于Lactobacillus的特征分型(LbTypes)
该研究所涉及到的6155个粪便宏基因组样本中,共在2141个样本中检测到Lactobacillus的存在(相对丰度>0.01%)。Lactobacillus的检出率与地理、年龄和个体身体条件有关系。
为进一步解释Lactobacillus的分布规律,该研究进一步分析了4303个健康人的粪便样本中Lactobacillus的分布特征。结果显示,有1459个样本中含有Lactobacillus,共涉及47个Lactobacillus物种,其中25个Lactobacillus物种分布频率较高(存在于至少5个样本中)(图1a)。该研究将25个Lactobacillus物种分为了3组(高频率分布、中频率分布和低频率分布),其中高频率组分布阈值为505-124,中频率组分布阈值124-30,低频率组分布阈值为30-10。同时,该研究还发现大量的样本中仅检出一种Lactobacillus物种(1013个样本),仅有6%样本中可以检出超过3个的Lactobacillus物种(图1b)。
进一步根据样本中Lactobacillus的丰度和分布对样本进行分型(LbTypes)。该研究通过无监督聚类方法确定了最佳聚类簇(图1c),结果显示当聚类数为6个时,轮廓得分(silhouette scores)最大且相对稳定。并且通过随机森林算法证实该分簇的准确性:选择50%的样本作为训练集,预测剩余50%样本的类型,准确率为93.5%-97.4%。
随机森林模型提供了每个物种导致簇间差异的影响力排名,得分前四的物种为L. ruminis,L. gasseri,L. casei,L. delbrueckii。这些物种可以作为每个簇的特征类群。进一步该研究结合随机森林算法和Fishers精确测试确定了每个簇的特征类群(图1d):LbType1:L. gasseri,L. salivarius,L. fermentum;LbType2:L. casei;LbType 3.:L. rhamnosus,L. salivarius,L. acidophilus,L. mucosae,L. sakei;LbType4:L. delbrueckii;LbType5:L. ruminis;LbType6:L. ruminis,L. delbrueckii;根据每个簇的特征类群,作者对每个群进行了命名,如图1e所示。
图1 a 健康人群粪便样本中Lactobacillus物种的分布频率;b 样本中检出Lactobacillus种类的统计;c 基于LbTypes分型的PCoA分析;d 左边的热图显示了六种LbType中高流行和中等流行的乳酸菌的发生百分比。发生百分比计算方法:某一特定物种在某一特定LbType样本中被检测到的次数除以该LbType样本总数,在某些LbType中显著富集的物种通过fisher精确测试鉴别;e 六种LbType的命名
2. Lactobacillus的地理分布模式
Lactobacillus的分布频率在不同地区之间存在较大的差异(附图S4),北美地区的Lactobacillus分布频率较低。
进一步,该研究比较了不同簇在地理上分布特征(图2a)以及不同地区所存在簇的组成特征(图2b)。欧洲地区样本中Delbrueckii LbTypes,Casei LbTypes,Mixed LbTypes和Gasseri/Salivarius/Fermentum(GSF) LbTypes的分布频率较高,但和与L. ruminis相关两个簇的分布频率较低。亚洲地区的样本与欧洲相反,与L. ruminis相关两个簇的分布频率在亚洲样本中较高。欧洲和北美样本均有较多的Delbrueckii LbTypes和Casei LbTypes,而亚洲样本中这两个簇较少(图2a)。这种现象可能与饮食习惯有关。
不同国家的样本中Lactobacillus的分布频率如图2c所示,澳大利亚、法国、蒙古、斐济和秘鲁的分布频率较高。其中法国样本中mixed LbTypes和Casei LbTypes的分布频率较高;澳大利亚样本中Delbrueckii LbTypes的分布频率较高。
图2 a 不同LbType的地区分布特征;b 不同地区LbType的组成特征;c 上部分的柱状图代表Lactobacillus的分布频率,绿色星号代表高分布频率。橙色代表低分布频率。下部分热图代表不同国家样本中六种LbType的数量,星号表示某一特定国家某LbType显著富集。
3.LbTypes与年龄,体重指数(BMI)和性别的关系
结果如图3a所示,北美样本中,老年组样本中Lactobacillus的分布频率是比其他组都要高的(P < 2.2e-10),相似的表型也出现在欧洲的样本中(P < 0.0012)。但是在欧洲样本中婴儿组样本中的Lactobacillus分布频率要比儿童、青少年、青年和中年组的样本高(P<0.013)。同时该研究发现在未工业化地区,老年组样本中的Lactobacillus的分布频率要比其他组的低。
进一步分析了不同年龄组中LbTypes的分布规律。在北美样本中,老年组样本中Mixed LbTypes,GFS LbTypes和Casei LbTypes的分布频率较高。在亚洲样本中(有年龄数据的仅有来自中国的样本),随着年龄的增长,Lactobacillus的增加并不明确,在统计上也不显著,这可能是因为现有的数据集中老年人的数量非常少。然而,该研究发现不同年龄组的LbType组成有显著差异,中年组样本中mixed LbTypes的分布频率较高,老年组样本中Ruminis LbType的分布频率较高。在非工业化国家样本中,Ruminis LbType的分布频率随着年龄的增加明显下降(仅基于15名老年受试者的数据)。除了年龄,进一步研究了Lactobacillus的分布频率与BMI和性别的关联,但通过分层的回归关联分析显示仅在欧洲样本中Lactobacillus的分布频率与BMI有关,这有可能与数据集有关系。Logistic回归分析结果如图3b所示,GSF LbType与年纪和BMI显著正相关,而mixed LbType显示负相关;Delbrueckii LbType与BMI和女性性别负相关;Ruminis LbType与BMI正相关。
图3 a上部分的柱状图代表Lactobacillus的分布频率,下部分热图代表不同年龄组样本中六种LbType的数量,星号表示某一特定年龄组某LbType显著富集。B LbType与年龄、BMI和性别的相关性分析,绿色代表显著正相关、橙色代表显著负相关、蓝色代表无相关性,值为-log10 P。
4. Lactobacillus的丰度与疾病的关系
该研究使用Logistic回归分析计算了Lactobacillus的丰度以及分布频率与疾病发生率的关系。如图4a所示,该研究鉴定到了19的关联关系(FDR < 0.1),涉及11个Lactobacillus物种和6种疾病。其中IBD、肝硬化和T2D的样本中Lactobacillus显著增加。IBD和肝硬化与6个Lactobacillus物种的分布频率增加有关:L. gasseri,L. salivarius,L. mucosae,L. delbrueckii,L. vaginalis和L. oris;T2D与L. amylovorus分布频率的增加有关。息肉和CRC与Lactobacillus分布频率的降低有关。
进一步,该研究探索了与多种疾病相关的肠道微生物类群是否也在不同的乳酸菌类型样本中显示出显著的差异。结果如图4b所示,GSF LbTypes的样本中富集了C. citroniae,C. symbiosum,C. bolteae,C. asparagiforme,C. symbiosum,Clostridialesbacterium 1_47FAA。同时,该研究也发现与GSF LbTypes的样本中与健康相关的物种少了:C. catus,E. rectale,B. crossotus,D. longicatena。与GSF LbTypes相反,Ruminis LbTypes的样本中富集了多个与健康相关的物种,并伴随着致病菌(pathobionts)的减少。
图4 a Lactobacillus单一物种以及所有总Lactobacillus分布频率与不同疾病之间的关联;b LbTypes与不同疾病的marker物种之间的关联。
结论
该研究收集了大量的人类肠道宏基因组样本,阐明了Lactobacillus的分布频率、丰度的分布模式以及地理差异。首先该研究提供了清晰的Lactobacillus在肠道中的种类数量:47,并且根据分布频率对他们进行了分组。进一步,该研究发现根据Lactobacillus物种的分布频率可以对样本进行分型(六个LbTypes)并指出了特征物种,提供了一种较为准确的分类方法。同时,该研究在全球尺度上分析了六个LbTypes的地理分布模式,并指出地理饮食差异带来的肠道Lactobacillus组成的影响。同时,该研究还发现部分Lactobacillus物种与疾病相关,增加了人们对乳酸菌的认知。另外,作者指出目前的研究依然存在缺陷:由于数据集中组间样本数量的差异以及参数统一性导致部分结论不能被证实,数据集的完善依然是今后研究需要努力的方向。
你可能还喜欢