进化树构建的基本过程（下） / 开普饭

昨天我们讲解了进化树构建的数据下载以及利用mega进行数据的比对：进化树构建的基本过程（上）。今天我们就来讲解一下如何利用利用mega构建简单的进化树。

PART3

最优模型选择

点击Data中的Phylogenetic Analysis，然后返回主页面。

点击MODELS中的Find Best DNA/Protein Models(ML) ，软件会根据你的数据帮你计算寻找最适合的模型，提高建树的精确度。

参数默认即可

运行界面如下，序列较多时，分析时间较长，闲的话可以去跑个PCR......

运行后结果如下。最重要的是BIC（BayesianInformation Criterion），越低代表模型越好。在这里就可以看到，BIC分数最低的模型是JTT+G，但软件不支持组合模型，所以我们选择单个模型中BIC分数最小的，此处为JTT。

PART4

建树

好，下面开始建树~

点击Phylogeny构建进化树，有多种建树方法，适用情况自行摸索哈，此处选择NJ邻接法建树。

弹出设置窗口，没有什么要求时默认即可。

Test of Phylogeny（建树的检验方法），是用来检验建树的质量的。默认的检验方法是Bootstrp method （步长检验）。步长检验需要设定检验次数，通常为100的倍数，默认设置为500，通常1000次以上较为可靠，这里设置1000。

Model处选择上文计算好的JTT。

Gap/Missing Date Treatment，大多数建树方法会要求删除多序列比对中含有空位较多的列。但是根据遗传距离度量方法的不同，删除原则不同。如果是以序列间不同残基的个数来度量遗传距离的话，选择Complete deletion；如果其他方法例如NJ，可以选择Partial deletion，程度约50%。