科研 | mBio: 粪便中短链脂肪酸以及肠道菌群的结构不能够预测结肠癌的状态
本文由登峰编译,十九、江舜尧编辑。
原创微文,欢迎转发转载。
结肠中的肠道菌群被认为与结肠癌的产生和发展有密切的联系,有些菌群可以改善结肠处炎症的症状,有些菌群会加重结肠部位的炎症。很多实验都证实短链脂肪酸(SCFAs)具有抗炎症的功效,它们是由结肠处的菌群通过代谢纤维素产生。我们通过16S rRNA测序以及宏基因组数据分析了来自于大量人群的肠道菌群,进而分析肠道内短链脂肪酸的含量与结肠癌的发展之间的联系。我们检测了粪便中乙酸、丙酸以及丁酸的含量,最后发现粪便中短链脂肪酸的含量与肿瘤的状态之间无显著性的联系。我们尝试使用随机森林模型对上述的相关性进行了分析,发现二者之间也无显著性的关联性。最后我们基于随机森林模型,利用扩增子测序以及宏基因组数据预测了对应样品中短链脂肪酸的含量。但是最后发现这些模型的准确性很低,得到的短链脂肪酸的浓度最大就是实际测量值的14%。之前有研究人员在更广泛的范围内对膳食纤维素与降低结直肠癌的风险之间的关系进行了流行病学的分析,本文结果与该结果是相似的。但是我们无法否认可能是其他的肠道代谢物是结肠癌的标记物,以我们目前的数据,我们只能说目前公认的短链脂肪酸是无法对结肠癌的产生与发展进行有效的预测。
论文ID
原名:Fecal Short-chain Fatty Acids Are Not Predictive of Colonic Tumor Status and Cannot Be Predicted Based on Bacterial Community Structure
译名:粪便中短链脂肪酸以及肠道菌群的结构不能够预测结肠癌的状态
期刊:mBio
IF:6.747
发表时间:2019
通信作者:Patrick D. Schloss
通信作者单位:Department of Microbiology and Immunology, University of Michigan, Ann Arbor, Michigan, USA
实验设计
(i)实验设计以及采样方法。粪便样品来源于172个健康人、198个罹患结肠腺瘤的患者以及120个罹患结肠癌的患者。在318个患者中,其中42个患有结肠腺瘤以及26个患有结肠癌的患的粪便采集于治疗后(采样间隔平均255天)。我们通过结肠镜以及对活体样本的组织病理切片的结果对肿瘤进行诊断。
(ii)特定短链脂肪酸的测定。乙酸、丙酸、异丁酸以及丁酸的测定方法为高效液相色谱法。但是有两处我们做了调整。首先,之前方法中将粪便样品悬浮于DNA Genotek OmniGut管中,本文直接将冷冻的粪便样品悬浮于PBS缓冲溶液中。其次,之前的方法中使用了粪便的平均质量对测得的短链脂肪酸含量进行归一化,本文直接采用了实际的粪便质量进行归一化。上述两处改变并不会影响粪便中短链脂肪酸的范围。异丁酸低于检测限,后期并没有对其进行分析。
(iii)16S rRNA基因测序数据的分析。测序引物依据16S rRNA的V4区进行设计,总长为250bp,测序时采用了Illumina MeSeq型号的测序仪。测序结果经过组装,然后去除质量较低的拼接片段。最后将相应的拼接数据按照97%的可能性归入OUT中,进行后续的分析。
(iv)宏基因组DNA测序分析。我们从Baxter等人发表的文章中抽取了部分的样品进行了宏基因组学的测序分析(健康人群27个样品;结肠腺瘤患者 25份;结肠癌患者26份)。然后将数据导入Sequence Read Archive(编号SRP108915)。然后借助于Illumina HiSeq测序平台,利用125bp长的片段对粪便DNA进行鸟枪法测序。
(v)随机森林模型的建立。本文我们建立了相应的区分模型,通过肠道菌群和/或短链脂肪酸含量对癌变进行预测。我们还从菌群信息入手结合回归模型对肠道内乙酸、丙酸以及丁酸的含量进行了预测。
(vi)统计学分析流程。本文采用R语言中的tidyverse包(v.1.2.1)为了对不同人群粪便中短链脂肪酸的含量进行比较,我们采用了Kruskal-Wallis 检验。
实验结果
粪便中短链脂肪酸的含量并未随着肿瘤治疗的程度发生变化
为了进一步的分析结直肠癌以及短链脂肪酸之间是否存在显著性的关系,我们对健康人群(n=172)、罹患结肠腺瘤(n=198)以及结肠癌(n=120)的粪便中乙酸、丙酸以及丁酸的含量进行了定量分析。但是通过统计学分析我们未能找到上述组别之间的差异(p>0.15,Fig.1A)。在所有罹患结肠腺瘤或者结肠癌的患者中,有41位的结肠腺瘤患者以及26位结肠癌患者是1年治疗一次,因此相应粪便也1年收集一次。在所选择的患者中未出现癌症复发的迹象,并且对应粪便中短链脂肪酸的含量并未产生很大的改变(p>0.058,Fig.1B)。此外,通过其他的统计学手段,也并未发现这些数据之间有显著性的差异。尽管对应的p值十分接近0.05,但是这种效果之间的差异非常的小,并且当考虑疾病级数时,这种效果无法得到统一(Fig.1)。以上的数据显示粪便中短链脂肪酸的含量与癌症的治疗效果之间没有显著性的差异。
图1 SCFA浓度与结肠病变的诊断、腺瘤或癌的治疗无显著差异。(A)浓度
健康(正常)结肠(172例)或腺瘤(198例)或癌(120例)患者的粪便SCFAs。(B)个人的子集诊断为腺瘤(41例)或癌(26例)并接受治疗的患者。
利用随机森林模型,借助短链脂肪酸的含量以及菌群的数据无法提高对罹患结肠腺瘤以及结肠癌的诊断正确率
之前我们认为,利用随机森林的机器学习模型,结合基于OUT的数据对相应的16S测序数据进行的分析可以使得我们区分罹患结肠腺瘤以及结肠癌的患者。本文我们将短链脂肪酸的含量也加入到该模型中一次修正上述的预测模型(补充材料Fig.S1)。当我们将短链脂肪酸加入模型预测中时,我们发现相应的ROC曲线存在中位区域,并且数值显著性的大于0.5。但是当使用ROC曲线的数值去预测是否存在结肠腺瘤或者结肠癌症状时,相应的数值分别只有0.54以及0.55,这些数据显示短链脂肪酸的含量无法准确的预测上述的疾病(Fig.2A)。并且数据还显示,是否加入短链脂肪酸的数值不影响上述模型的预测特性。以上的数据显示人群粪便中短链脂肪酸的含量无法提高诊断结肠病变的准确性。
随机森林模型无法准确的使用菌群数据预测短链脂肪酸的含量
接着我们会问,如果不考虑患者中疾病的诊断问题,肠道菌群的数据是否可以预测粪便中短链脂肪酸的含量。我们使用随机森林中的回归模型使用OUT数值以及属水平的数值去预测粪便中短链脂肪酸的含量(Fig.S2)。结果显示,在所有的预测结果中,基于属水平的数值预测丁酸的含量的预测结果与实际结果之间的相关性最大,但是R2值也只有0.14(Fig.2B)。我们还使用了少量的来自于上述人群粪便的宏基因组学数据对模型进行了修正。于16S rRNA测序数据类似的时,宏基因组的数据也无法对短链脂肪酸的浓度进行准确的预测。当使用KEGG数据对丙酸浓度进行预测时的准确性最高,但是相关系数只有0.055(Fig.2B)。由于宏基因组数据量太少,我们使用16S rRNA测序数据去代替宏基因组数据,并将其导入PICRUSt中进行代谢通路的富集分析(Fig.S2)。但是此时也不能对短链脂肪酸的浓度进行准确的预测;同样,利用KEGG数据对丙酸含量的预测最为准确,但是相关系数也仅仅有0.085(Fig.2B)。以上数据表明,目前我们的手段无法通过肠道菌群的数据对短链脂肪酸的浓度进行有效的分析,这些问题也提示我们目前我们掌握的菌群的种类以及相应的基因还不足以预测粪便中短链脂肪酸的浓度。
图2 SCFA浓度不能改善诊断腺瘤、癌或所有病变的模型,不能从16S rRNA基因或宏基因组序列数据中可靠地预测。( a)使用SCFA诊断患有腺瘤或癌的个体的中位AUROC稍优于偶然(横线代表0.5)。(b)使用16SrRNA基因序列、宏基因组和PICRUSt数据模拟的回归模型,以预测SCFA的浓度。
总结
我们目前的数据无法将粪便中短链脂肪酸的含量与是否有罹患结肠腺瘤或者结肠癌的风险相关联,而且目前短链脂肪酸的含量还不能作为对结肠癌患者诊断的指标。此外,肠道菌群的种属以及基因结构还不能作为预测短链脂肪酸的含量。本文结果对其他文献的结果是个很好的补充,其他文章中谈到,摄食纤维素一次产生的短链脂肪酸无法减少罹患结肠癌的风险。有一点需要注意,本文研究涉及到的短链脂肪酸以及肠道菌群的数据均来自同一个时间点采样。此外,我们还发现对病变部位的粘膜进行有效的观察可能会提供于病变发生可能性更强的关联性。未来,最为紧迫的事情就是发展新的假设去研究肠道菌群如何与宿主互作,这些研究对于我们研究肿瘤的发生以及寻找相应的生物标志物,进而预测病变的发生非常有利。
你可能还喜欢