更新版 | 共线性!WGDI 一键搞定 - ColinearScan 改进版!
共线性分析
作为王希胤老师课题组的学生,共线性相关分析上,一直没有提出更方便或深刻的方法,着实有点儿惭愧。王老师是共线性分析软件ColinearScan
的第一作者和MCscan
的重要作者。在我们课题组内,常常用的还是Colinearscan
。总的来说,两个软件目前都有一定的用户。
MCScan
和Colinearscan
在共线性区块的提取上有细微差别,具体效果上,各有优劣。两个软件都是基于动态规划来实现共线性区块提取,而主要区别在于对同源基因对的具体判别。
Colinearscan
的筛选规则是:一个基因相对另一个基因组同源基因的数量限制(repeat_number的参数,blast结果的过滤)。MCscan
的筛选规则是:任意两条染色体间(即点图中的一个小方块内部),一个基因相对另外一套染色体上的基因个数(默认为5,主要到 MCscan读取的是所有比对结果,并无类似repeat_number的过滤参数)。具体体现到结果上,ColinearScan 提取的是前面点图中看到的片段,古老加倍的片段常常不如 MCscan 的完整。MCscan 能够提取到更古老的片段,但会有较多不准确的片段被提取。
使用 wgdi (改进版的 ColinearScan)
获取参数配置
wgdi -icl ? >> total.conf
wgdi是改进后colinearscan程序,python编写,不需要c环境。
修改配置文件
vim total.conf
[collinearity]
gff1 = Grape.gff
gff2 = Grape.gff
lens1 = Grape.len
lens2 = Grape.len
blast = Grape.blastp
blast_reverse = False
evalue = 1e-5
score = 100
grading = 50,40,25
mg = 40,40
repeat_number = 20
positon = order
process = 6
savefile = Grape.colinearity
注意到,最近wgdi
更新了,增加了process参数,支持多线程!
运行完成可以看到
写在最后
好的软件,总是持续更新。
赞 (0)