抽平计算alpha多样性有多大概率出错?怎么办?
写在前面
我们目前只能使用抽平的方式计算alpha多样性,然而有一定的概率出错。
请看下面的图示:
我们看到,让每个环境都抽取两个物种时,物种数量可能出现评估错误。这种抽平会影响稀有物种的评估。但是随着测序深度的增加,这种影响变得很小。所以一直以来我也没有考虑过这个问题,直到看到一篇文章:
题目:
Soil textural - heterogeneity impacts bacterial but not fungal diversity
期刊:
Soil Biology and Biochemistry
影响因子:
5.024
发表时间:
2020
第一作者:
Seaton Fiona M.
第一作者单位:
Bangor University, UK
原文链接:
https://doi.org/10.1016/j.soilbio.2020.107766
材料方法中有这样一段话,翻译为中文:
为了说明样本之间读取深度的差异,细菌和真菌OTU分别稀疏化到18800和1500序列。对细菌重复进行50次抽平,对真菌进行100次抽平,都用于计算alpha多样性,并将全部结果四舍五入的平均值用于计算丰富度。
原文
To account for differences in read depth across samples, the bacterial and fungal OTU tables were rarefied to 18800 and 1500 reads respectively. Rarefaction was repeated 50 times for bacteria and 100 times for fungi and the rounded mean used for the calculation of richness.
这里真菌计算了100次,因为真菌可用序列数量太少了,所以增加抽样次数,稳定最终多样性结果。
回到问题:抽平计算alpha多样性有多大概率出错?怎么办?
出错概率很小
随着序列数量不断增多,错误概率越来越小
增加抽平次数,多次计算alpha多样性,求取均值可以有效改善序列数小的样本多样性结果。