科研 | ISME:结合全基因组和扩增子测序提高对植物叶片中微生物-微生物相互作用网络的检测的激活
编译:Rivc,编辑:小菌菌、江舜尧。
原创微文,欢迎转发转载。
论文ID
原名:Combining whole-genome shotgun sequencing and rRNA gene amplicon analyses to improve detection of microbe–microbe interaction networks in plant leaves
译名:结合全基因组和扩增子测序提高对植物叶片中微生物-微生物相互作用网络的检测
期刊:The ISME Journal
IF:9.493
时间:2020.4
通讯作者:Detlef Weigel
通讯作者单位:普朗克发育生物学研究所
实验设计
植物样本取自Gniebel, Eyach (EY), Pfrondorf (PFN), 和 Jugendhaus Einsiedel (JUG)。四个不同采样批次。
批次0-单个植物:2014年秋天,在热尼贝尔村采集到一株同时感染了透明球藻和白球藻的植物,使用无菌镊子和剪刀,置于无菌的15毫升试管中,冰冻带回实验室,在零下80°C冷冻,直到进一步处理。冷冻植物在液氮存在的情况下,用研钵和杵碾碎,进行DNA提取。
批次1-9株植物剪切方法:2014年12月下旬,从EY采集9种植物进行取样。在实验室中,有3个花结没有洗,3个用无菌水洗,3个用Silwet L-77溶解。研磨后DNA提取。建立两种数据库。
批次2-建立90株植物:植物于2014年秋季和2015年春季从EY和PFN采集。研磨后进行DNA提取。并建立宏基因组数据库。
批次3-建立176株植物:植物采自EY(2015年12月11日和3月23日2016)、JUG(2016年12月15日和2016年3月31日)和PFN(31日2016年3月)。研磨后进行DNA提取并建立宏基因组数据库。构建16S rDNA V4文库、ITS1数据库及测序。
结果
1 宏基因组中微生物分类群概述
总体而言,每个样品微生物存在较大差异,绝大多数微生物序列被鉴定为细菌。不同植物(图1),季节和位置的生物分类组成不同。Sphingomonadaceae 和Pseudomonadaceae 始终被列为最丰富的细菌科(图1b)。尽管两者都很常见,但它们在样本之间的表现却大不相同:Pseudomonadaceae的相对丰度差异很大,一些样本相对于其余菌种的计数要高得多,而Sphingomonadaceae的在样品之间的差异甚至更大(图 1b, 3e).
图1. shotgun测序得到的野生拟南芥叶微生物群。a细菌读数的相对丰度占每个样品中总读数的一部分。b用植物染色体规模的读数计数计算的十个最普遍的细菌家族的相对丰度。样品按与a中相同的顺序按批处理进行分组。
2 地点、季节和宿主基因的影响
比较微生物组组成的一种常见方法是基于Bray-Curtis差异度量。为了评估样本中的微生物群之间如何相互联系,我们使用PCA代替了Bray-Curtis的相似性。首先通过获取科水平丰度表来转换数据,包括所有细菌,真菌和卵菌类。这种转换纠正了生态数据集常见的计数分布中的正偏度,并且还减少了高丰度微生物的影响。尽管收集地点似乎效果最好(图2a,b和补充图13),但没有一个元数据变量可以清楚地解释PCA中沿主轴的分布。样品的聚类最明显地是由每个样品中最丰富的分类单元驱动的,该特征与采集地点相关。比较PC1和PC2时,Pseudomonadaceae或Sphingomonadaceae的分离很明显,而将PC2和PC3的比较,则可以看到较不丰富的类群的分离(补充图14)。
最后,使用丰富的植物读物进行宿主基因分型,使用FreeBayes从读物中调用接近100万个SNP,并高质量映射到TAIR10参考基因组。与采样点相关的有几个清晰的植物基因型簇(图2c),与德国西南部的拟南芥(A.thaliana)的林分一致,通常只携带有限数量的基因型。众所周知,宿主基因型可以影响叶片微生物组的组成,但是由于基因型与野生种群中的位点紧密相关,因此这两个变量会混淆,并且需要附加数据才能分离出。
在正交分析中,首先将读物广泛分类为细菌,真菌,植物或未分类,然后使用MASH比较每个类别中样品之间的总体序列相似性,该方法可测量k-mer丰度的相似性。MASH不考虑分类序列,因此从数据中的模式不依赖于SNP调用,分类和合并的意义上说,提供了完整性检查。这种与分类无关的分析捕获了数据中的许多相同模式,其中PCoA涉及细菌,真菌,植物或未分类读物之间的MASH距离,这也导致样品在一定程度上按收集地点聚集。
3 微生物相互关系网络
Shotgun测序可对微生物组样品中微生物的真实丰度进行最小程度的估计。我们调查了所有样品中以及不同数据转换下的微生物丰度,以了解定植模式和潜在的微生物间关系。首先绘制了通过过滤阈值的所有细菌家族之间成对线性相关的图。平均而言,给定的分类单元与其他13个分类单元呈正相关,但是由于许多植物中仅见到的分类单元之间的相关性通常不显着,因此它严重偏向于许多样品中存在的微生物。另外,细菌负荷在样品之间变化很大,并且与每个分类群相关的序列的丰度正相关(补充图17)。这仅导致分类群之间的正相关(图3a)。也就是说,较高的细菌载量意味着几乎所有分类单元都具有较高的丰度,尽管某些分类单元(如假单胞菌科)对微生物负载的贡献要大于其他种类。
如果在分析之前将所有样品中的细菌数据转换为相对丰度,则表格将构成成分,并且由于所有分类单元的总和不变,因此分类单元的丰度估计将受到限制。这极大地混淆了相关的方向性。例如,当一个分类单元成为支配地位时,它将自动减少所有其他分类单元的丰度,这很容易误导一个结论,即占主导地位的分类单元的数量以牺牲其他分类单元的数量为代价。当对我们的数据集进行相对丰度转换时,分类群之间的许多正相关性消失或变为负值,包括Pseudomonadaceae和Sphingomonadaceae之间的正相关(图3)。在整个数据集以及各个采样点都观察到了这种趋势。
居中对数比(CLR)将样本中每个分类单元的丰度与该样本中所有分类单元的几何平均值相关联。除了以这种方式消除相对丰度的范围约束之外,CLR通过进一步取对数,还大大降低了高度丰富的异常值扭曲其他分类单元的值的能力。 CLR正确地识别了我们数据集中的Pseudomonadaceae 和 Sphingomonadaceae之间的正相关,尽管它高估了相关的强度
图3 通过绝对和相对丰度数据推断出的相反的分类间相关性。
4 宏基因组和扩增子数据的一致性
为了对比来自元基因组和扩增子测序的信息,我们集中于最大的批次,第3批次,有176个样品。我们对这些样品进行PCR扩增并测序了细菌16S rDNA的V4区和真菌ITS1区。因为拟南芥相关蓝细菌的V4 16S rDNA序列是与叶绿体的区别不明显,忽略了带有蓝细菌的读物,并且也从元基因组数据集中删除了蓝细菌的读物。基于16S rDNA扩增子的细菌家族分配与元基因组之间的一致性非常高(图4a),在第四次根转化数据上,皮尔逊相关系数R2的总和为0.78(图4b)。在顶级分类单元中,与宏基因组学估计相比,假单胞菌科的16S rDNA估计值略低,而Sphingobacteriaceae和Oxalobacteraceae的16S rDNA估计略高(图4a,b)。作为补充比较,我们仅提取了16S rDNA从元基因组读取序列并使用phyloFlash对其分类。当对16S rDNA扩增子作图时,已对其进行了二次采样以匹配元基因组16S rDNA读数计数,总体相关性和高估/低估趋势与将扩增子与所有元基因组读数进行比较的结果相同(图4e,与图4b进行比较)。从ITS1扩增子或元基因组推导的真菌家族之间的一致性比细菌家族弱(图4f,g),皮尔逊相关系数R2为0.14。有几个因素可能会解释这种差异。首先,由于真菌总体上不那么丰富,因此它们的定量基于较少的序列,因此噪音较大。一致的是,最丰富的真菌科(Ceratobasidiaceae)的变基因组与扩增子数据的皮尔逊相关系数R2很大。高于真菌的平均值,R2 = 0.88。在其他家族中,Helicoceae的相关性特别差,并且在ITS1数据中含量更高(图4f,g)。虽然这可能是由于该家族的ITS1引物偏向于其他物种,但也可能是该家族的元基因组序列更经常被错误地分配给其他与序列相关的家族,从而减少了Helotiaceae的数量。数据集之间差异的另一个潜在来源可能是真菌基因组的变化范围比细菌大得多,而rDNA拷贝与真菌基因组大小的相关性很弱。这可能会导致偏差,因为具有更大基因组的物种由于更多的定位图读取而在元基因组中似乎具有更高的丰度。另一方面,由于较大的基因组可能没有更多的rDNA拷贝,因此ITS1扩增子数量受基因组大小差异的影响较小。此外,由于与细菌基因组相比,真菌基因组所占的比例要小得多,因此可以编码蛋白质,并且由于真菌中的基因数量变化远小于基因组大小,因此,在用于读物的分类和定量。
宏基因组与16S rDNA相对丰度之间的紧密一致性使得能够根据从宏基因组数据中获得的细菌负荷来缩放16S rDNA扩增子数据。使用扩增子,使用PNA寡聚体或特殊的封闭引物可以更容易地封闭丰富的植物宿主DNA。对于植物DNA含量高的样品,扩增子测序可比元基因组测序以更低的成本对更多的微生物进行采样。目前,扩增子数据库中的条目比完整的基因组或蛋白质数据库更均匀地代表了微生物的分类学广度,因此可以提供更一致的分类。此外,我们估计30,000个读段的相对较浅的元基因组测序,要达到分配微生物分类法,足以找到足够的可分类读物,以估计样品的细菌载量。使用了根据植物规模的基因组数据计算出的细菌载量来调整16S rDNA数据的丰度,以反映估计的载量(图3c)。正如预期的那样由于16S rDNA与元基因组数据密切相关,因此调整后的16S rDNA数据准确地捕获了整个数据集中假单胞菌科和鞘翅目科的微正相关(图3d)。
图4 通过并行扩增子数据增强元基因组数据的效用。
讨论
所有样品细菌中细菌分类群的相对丰度与16S rDNA扩增子测量高度一致,对于最丰富的分类群,相关性最高(图4)。元基因组中真菌的相对丰度与ITS1扩增子的相关性较差,部分原因可能是与细菌相比,它们的丰度较低以及真菌基因组更为复杂。尽管如此,元基因组数据清楚地表明,真菌在拟南芥叶中无处不在,即使它们通常只是整个拟南芥叶球微生物群中的一小部分。
使用shotgun测序来估计样品之间的微生物负荷,这些样本之间的差异很大。绝对估计值使我们能够揭示通过稀疏或总和缩放将细菌或真菌归一化为共同值的程度,这是通常的做法,可能会误导研究人员将相对丰度的增加或减少等同于绝对丰度的变化。
使用负载校正的细菌分类学概况来探索微生物组之间的异同。没有发现任何环境或宿主遗传因素对叶群落结构的强烈个体影响,尽管两者都有一定的组合(图2,补充图13)。发现样本中最丰富的分类单元预测了样本中其他微生物的群落结构。在自然宿主种群中,每个位点的遗传多样性不足以使我们无法分辨微生物基因组组成的位点和宿主基因型是否需要确定遗传相同宿主之间的变异是仅反映随机效应还是微生物环境的变异,微生物生态学的一个重要目标是揭示社区成员之间的特定相互作用,这可以指出关键的分类单元这些对社区组成有重要影响。相关网络为此类研究提供了有价值的工具;已经证明,基于相对丰度的相关性可以导致与基于绝对丰度的相关性非常不同的网络(图3)。在我们的特定案例中,相对丰度数据表明,假单胞菌科和Sphingomonadaceae是两种通常在叶片微生物组中发现的最常见细菌家族是负相关的,而实际上它们是正相关的,例如用绝对丰度数据证明。也观察到了其他几个分类单元对的这种模式。令人惊讶的是,当使用负载校正的数据时,统计显着的相关性在我们的数据集中始终为正。这可以简单地反映出社区成员之间总体上稳定的关系,从而使他们在植株定植时倾向于成功或失败。
你可能还喜欢