科研 | ISME：结合全基因组和扩增子测序提高对植物叶片中微生物-微生物相互作用网络的检测的激活 / 开普饭

编译：Rivc，编辑：小菌菌、江舜尧。

原创微文，欢迎转发转载。

导读

来自生活各个领域的微生物与植物建立了联系。尽管有些危害植物，但其他一些则可以拮抗病原体或启动植物免疫系统，支持营养获取，调节植物激素水平或提供其他服务。大多数与培养无关的植物微生物组研究都集中在16S rRNA基因和/或rRNA基因组位点的内转录间隔子(ITS)的扩增子测序上，这些序列显示了微生物之间的相对丰度。在这里，我们描述了来自德国西南部的275个野生拟南芥叶片微生物群落的鸟枪测序，以及来自176个样本的额外的细菌16S和真核生物ITS1 rRNA扩增子数据。Shotgun数据与扩增子数据不同，它捕获了微生物与植物DNA的比例，从而能够缩放微生物读取的丰度，以反映宿主上的微生物负荷。在更具成本效益的混合策略中，我们证明了它们还可以对扩增子数据进行类似的缩放，以克服组成问题。野生植物以细菌序列为主，而真核生物仅贡献少数序列。微生物隶属关系显示与起源位点和植物基因型之间的关联较弱，这两者在该数据集中都高度混乱。微生物群之间存在很大差异，一个极端包括感染植物典型的低复杂度和高载量微生物样本，另一个极端是复杂度高和微生物载量低的样本。重要的是，考虑绝对微生物负荷导致了关于主要分类群之间的微生物组装和相互作用网络的根本不同的结论。

论文ID

原名：Combining whole-genome shotgun sequencing and rRNA gene amplicon analyses to improve detection of microbe–microbe interaction networks in plant leaves

译名：结合全基因组和扩增子测序提高对植物叶片中微生物-微生物相互作用网络的检测

期刊：The ISME Journal

IF：9.493

时间：2020.4

通讯作者：Detlef Weigel

通讯作者单位：普朗克发育生物学研究所

实验设计

植物样本取自Gniebel, Eyach (EY), Pfrondorf (PFN), 和 Jugendhaus Einsiedel (JUG)。四个不同采样批次。

批次0-单个植物：2014年秋天，在热尼贝尔村采集到一株同时感染了透明球藻和白球藻的植物,使用无菌镊子和剪刀，置于无菌的15毫升试管中，冰冻带回实验室，在零下80°C冷冻，直到进一步处理。冷冻植物在液氮存在的情况下，用研钵和杵碾碎，进行DNA提取。

批次1-9株植物剪切方法：2014年12月下旬，从EY采集9种植物进行取样。在实验室中，有3个花结没有洗，3个用无菌水洗，3个用Silwet L-77溶解。研磨后DNA提取。建立两种数据库。

批次2-建立90株植物：植物于2014年秋季和2015年春季从EY和PFN采集。研磨后进行DNA提取。并建立宏基因组数据库。

批次3-建立176株植物：植物采自EY(2015年12月11日和3月23日2016)、JUG(2016年12月15日和2016年3月31日)和PFN(31日2016年3月)。研磨后进行DNA提取并建立宏基因组数据库。构建16S rDNA V4文库、ITS1数据库及测序。

后续试验进行扩增子处理，聚类及分类，宏基因组分析。分类关联和网络计算，确定植物基因型，调整16S rDNA扩增子数据，比较16S rDNA宏基因组与16S rDNA V4扩增子。

结果

1 宏基因组中微生物分类群概述

总体而言，每个样品微生物存在较大差异，绝大多数微生物序列被鉴定为细菌。不同植物（图1），季节和位置的生物分类组成不同。Sphingomonadaceae 和Pseudomonadaceae 始终被列为最丰富的细菌科(图1b)。尽管两者都很常见，但它们在样本之间的表现却大不相同：Pseudomonadaceae的相对丰度差异很大，一些样本相对于其余菌种的计数要高得多，而Sphingomonadaceae的在样品之间的差异甚至更大(图 1b, 3e).

图1. shotgun测序得到的野生拟南芥叶微生物群。a细菌读数的相对丰度占每个样品中总读数的一部分。b用植物染色体规模的读数计数计算的十个最普遍的细菌家族的相对丰度。样品按与a中相同的顺序按批处理进行分组。

2 地点、季节和宿主基因的影响

比较微生物组组成的一种常见方法是基于Bray-Curtis差异度量。为了评估样本中的微生物群之间如何相互联系，我们使用PCA代替了Bray-Curtis的相似性。首先通过获取科水平丰度表来转换数据，包括所有细菌，真菌和卵菌类。这种转换纠正了生态数据集常见的计数分布中的正偏度，并且还减少了高丰度微生物的影响。尽管收集地点似乎效果最好（图2a，b和补充图13），但没有一个元数据变量可以清楚地解释PCA中沿主轴的分布。样品的聚类最明显地是由每个样品中最丰富的分类单元驱动的，该特征与采集地点相关。比较PC1和PC2时，Pseudomonadaceae或Sphingomonadaceae的分离很明显，而将PC2和PC3的比较，则可以看到较不丰富的类群的分离（补充图14）。

最后，使用丰富的植物读物进行宿主基因分型，使用FreeBayes从读物中调用接近100万个SNP，并高质量映射到TAIR10参考基因组。与采样点相关的有几个清晰的植物基因型簇（图2c），与德国西南部的拟南芥（A.thaliana）的林分一致，通常只携带有限数量的基因型。众所周知，宿主基因型可以影响叶片微生物组的组成，但是由于基因型与野生种群中的位点紧密相关，因此这两个变量会混淆，并且需要附加数据才能分离出。

在正交分析中，首先将读物广泛分类为细菌，真菌，植物或未分类，然后使用MASH比较每个类别中样品之间的总体序列相似性，该方法可测量k-mer丰度的相似性。MASH不考虑分类序列，因此从数据中的模式不依赖于SNP调用，分类和合并的意义上说，提供了完整性检查。这种与分类无关的分析捕获了数据中的许多相同模式，其中PCoA涉及细菌，真菌，植物或未分类读物之间的MASH距离，这也导致样品在一定程度上按收集地点聚集。

图2 优势类群对微生物群落结构的影响。

3 微生物相互关系网络

Shotgun测序可对微生物组样品中微生物的真实丰度进行最小程度的估计。我们调查了所有样品中以及不同数据转换下的微生物丰度，以了解定植模式和潜在的微生物间关系。首先绘制了通过过滤阈值的所有细菌家族之间成对线性相关的图。平均而言，给定的分类单元与其他13个分类单元呈正相关，但是由于许多植物中仅见到的分类单元之间的相关性通常不显着，因此它严重偏向于许多样品中存在的微生物。另外，细菌负荷在样品之间变化很大，并且与每个分类群相关的序列的丰度正相关（补充图17）。这仅导致分类群之间的正相关（图3a）。也就是说，较高的细菌载量意味着几乎所有分类单元都具有较高的丰度，尽管某些分类单元（如假单胞菌科）对微生物负载的贡献要大于其他种类。

如果在分析之前将所有样品中的细菌数据转换为相对丰度，则表格将构成成分，并且由于所有分类单元的总和不变，因此分类单元的丰度估计将受到限制。这极大地混淆了相关的方向性。例如，当一个分类单元成为支配地位时，它将自动减少所有其他分类单元的丰度，这很容易误导一个结论，即占主导地位的分类单元的数量以牺牲其他分类单元的数量为代价。当对我们的数据集进行相对丰度转换时，分类群之间的许多正相关性消失或变为负值，包括Pseudomonadaceae和Sphingomonadaceae之间的正相关（图3）。在整个数据集以及各个采样点都观察到了这种趋势。

居中对数比（CLR）将样本中每个分类单元的丰度与该样本中所有分类单元的几何平均值相关联。除了以这种方式消除相对丰度的范围约束之外，CLR通过进一步取对数，还大大降低了高度丰富的异常值扭曲其他分类单元的值的能力。 CLR正确地识别了我们数据集中的Pseudomonadaceae 和 Sphingomonadaceae之间的正相关，尽管它高估了相关的强度

图3 通过绝对和相对丰度数据推断出的相反的分类间相关性。

4 宏基因组和扩增子数据的一致性

为了对比来自元基因组和扩增子测序的信息，我们集中于最大的批次，第3批次，有176个样品。我们对这些样品进行PCR扩增并测序了细菌16S rDNA的V4区和真菌ITS1区。因为拟南芥相关蓝细菌的V4 16S rDNA序列是与叶绿体的区别不明显，忽略了带有蓝细菌的读物，并且也从元基因组数据集中删除了蓝细菌的读物。基于16S rDNA扩增子的细菌家族分配与元基因组之间的一致性非常高（图4a），在第四次根转化数据上，皮尔逊相关系数R2的总和为0.78（图4b）。在顶级分类单元中，与宏基因组学估计相比，假单胞菌科的16S rDNA估计值略低，而Sphingobacteriaceae和Oxalobacteraceae的16S rDNA估计略高（图4a，b）。作为补充比较，我们仅提取了16S rDNA从元基因组读取序列并使用phyloFlash对其分类。当对16S rDNA扩增子作图时，已对其进行了二次采样以匹配元基因组16S rDNA读数计数，总体相关性和高估/低估趋势与将扩增子与所有元基因组读数进行比较的结果相同（图4e，与图4b进行比较）。从ITS1扩增子或元基因组推导的真菌家族之间的一致性比细菌家族弱（图4f，g），皮尔逊相关系数R²为0.14。有几个因素可能会解释这种差异。首先，由于真菌总体上不那么丰富，因此它们的定量基于较少的序列，因此噪音较大。一致的是，最丰富的真菌科（Ceratobasidiaceae）的变基因组与扩增子数据的皮尔逊相关系数R²很大。高于真菌的平均值，R² = 0.88。在其他家族中，Helicoceae的相关性特别差，并且在ITS1数据中含量更高（图4f，g）。虽然这可能是由于该家族的ITS1引物偏向于其他物种，但也可能是该家族的元基因组序列更经常被错误地分配给其他与序列相关的家族，从而减少了Helotiaceae的数量。数据集之间差异的另一个潜在来源可能是真菌基因组的变化范围比细菌大得多，而rDNA拷贝与真菌基因组大小的相关性很弱。这可能会导致偏差，因为具有更大基因组的物种由于更多的定位图读取而在元基因组中似乎具有更高的丰度。另一方面，由于较大的基因组可能没有更多的rDNA拷贝，因此ITS1扩增子数量受基因组大小差异的影响较小。此外，由于与细菌基因组相比，真菌基因组所占的比例要小得多，因此可以编码蛋白质，并且由于真菌中的基因数量变化远小于基因组大小，因此，在用于读物的分类和定量。

宏基因组与16S rDNA相对丰度之间的紧密一致性使得能够根据从宏基因组数据中获得的细菌负荷来缩放16S rDNA扩增子数据。使用扩增子，使用PNA寡聚体或特殊的封闭引物可以更容易地封闭丰富的植物宿主DNA。对于植物DNA含量高的样品，扩增子测序可比元基因组测序以更低的成本对更多的微生物进行采样。目前，扩增子数据库中的条目比完整的基因组或蛋白质数据库更均匀地代表了微生物的分类学广度，因此可以提供更一致的分类。此外，我们估计30,000个读段的相对较浅的元基因组测序，要达到分配微生物分类法，足以找到足够的可分类读物，以估计样品的细菌载量。使用了根据植物规模的基因组数据计算出的细菌载量来调整16S rDNA数据的丰度，以反映估计的载量（图3c）。正如预期的那样由于16S rDNA与元基因组数据密切相关，因此调整后的16S rDNA数据准确地捕获了整个数据集中假单胞菌科和鞘翅目科的微正相关（图3d）。

图4 通过并行扩增子数据增强元基因组数据的效用。

讨论

在自然或田间栽培植物种群的背景下描述与叶圈相关的微生物群落，对于理解和设计保护和农业中的微生物干预措施至关重要。多年来，与其他微生物群落的研究一样，通过分离和培养特定的叶片微生物定性地进行了叶圈微生物群的研究。随着高通量扩增子和短读测序的出现，解决以定量方式与其宿主相互作用的更大的分类单元群体变得更加容易。在这里，我们调查了全基因组short-read测序研究叶片微生物组的优点和局限性。

所有样品细菌中细菌分类群的相对丰度与16S rDNA扩增子测量高度一致，对于最丰富的分类群，相关性最高（图4）。元基因组中真菌的相对丰度与ITS1扩增子的相关性较差，部分原因可能是与细菌相比，它们的丰度较低以及真菌基因组更为复杂。尽管如此，元基因组数据清楚地表明，真菌在拟南芥叶中无处不在，即使它们通常只是整个拟南芥叶球微生物群中的一小部分。

使用shotgun测序来估计样品之间的微生物负荷，这些样本之间的差异很大。绝对估计值使我们能够揭示通过稀疏或总和缩放将细菌或真菌归一化为共同值的程度，这是通常的做法，可能会误导研究人员将相对丰度的增加或减少等同于绝对丰度的变化。

使用负载校正的细菌分类学概况来探索微生物组之间的异同。没有发现任何环境或宿主遗传因素对叶群落结构的强烈个体影响，尽管两者都有一定的组合（图2，补充图13）。发现样本中最丰富的分类单元预测了样本中其他微生物的群落结构。在自然宿主种群中，每个位点的遗传多样性不足以使我们无法分辨微生物基因组组成的位点和宿主基因型是否需要确定遗传相同宿主之间的变异是仅反映随机效应还是微生物环境的变异，微生物生态学的一个重要目标是揭示社区成员之间的特定相互作用，这可以指出关键的分类单元这些对社区组成有重要影响。相关网络为此类研究提供了有价值的工具；已经证明，基于相对丰度的相关性可以导致与基于绝对丰度的相关性非常不同的网络（图3）。在我们的特定案例中，相对丰度数据表明，假单胞菌科和Sphingomonadaceae是两种通常在叶片微生物组中发现的最常见细菌家族是负相关的，而实际上它们是正相关的，例如用绝对丰度数据证明。也观察到了其他几个分类单元对的这种模式。令人惊讶的是，当使用负载校正的数据时，统计显着的相关性在我们的数据集中始终为正。这可以简单地反映出社区成员之间总体上稳定的关系，从而使他们在植株定植时倾向于成功或失败。

本研究探讨了组成数据转换（如CLR）的有用性。虽然这些是对天真的方法的改进，但与使用真实的绝对丰度信息相比，我们发现它们是缺乏的，并且我们必须得出结论，关于微生物负荷的直接信息无可替代。我们注意到，有时候一旦栖息地的承载能力达到这一点时，一个分类单元的增加只能以其他分类单元为代价。掩盖组成性影响的转换将隐藏潜在的生物学。总而言之，我们已经证明了单独或与16S rDNA和ITS1扩增子测序结合使用元基因组shotgun测序测序的优势，可用于测量拟南芥叶片中的微生物群落。适度的读取深度，每个样品只有300,000次非植物读取，足以实现与扩增子测序相当的定量生物分类分配，每个样品30,000总读取量足以可靠地量化微生物负荷。假设微生物负荷在很大程度上与植物基因组大小无关，这似乎是合理的。这意味着在具有2.5 Gb基因组的玉米中，比在0.13 Gb基因组中需要近20倍的测序时间，尽管这可能被高估了，因为基因组较大的植物往往具有更大的细胞。每个都可能支持更多的微生物细胞。然而，尽管还有待研究其他物种的微生物负荷，但这是在生态环境中使用拟南芥进行微生物组研究的另一个原因。另一方面，使用较低覆盖率的元基因组数据来估计微生物负荷并使用此信息来缩放扩增子数据的混合方法可以经济高效地支持具有较大基因组的植物的内生分析。宿主细胞大小或宿主细胞密度的差异可能会干扰通过测序计算得出的微生物负荷的解释，因此在尝试比较不同宿主之间的数据时应格外小心。最后，缺少高质量的参考基因组不会成为一个严重的障碍。

你可能还喜欢

科研 | ISME：结合全基因组和扩增子测序提高对植物叶片中微生物-微生物相互作用网络的检测的激活

相关推荐