【直播】我的基因组 34:Qualimap对比对好的bam文件进行统计及可视化
上一讲我们说道Qualimap这个软件,那我们现在仔细了解下这个软件吧!
比如下面这个覆盖度与测序深度的图来说:
如果我们自己要对55G的bam文件进行统计,可以sort好之后用samtools的mpileup功能来自己写脚本来区分染色体,分别统计覆盖度和测序深度,再绘图。但其实有很多优秀的工具也可以做到,而且是一步到位,还附送非常多的其它统计指标,比如Qualimap,有点类似于fastqc,也非常好用!
软件安装如下:
## Download and install Qualimap
## http://qualimap.bioinfo.cipf.es/
cd ~/biosoft
mkdir Qualimap && cd Qualimap
wget https://bitbucket.org/kokonech/qualimap/downloads/qualimap_v2.2.1.zip
## readme http://qualimap.bioinfo.cipf.es/doc_html/index.html
## example results :http://kokonech.github.io/qualimap/HG00096.chr20_bamqc/qualimapReport.html
~/biosoft/bamtools/bamtools/bin/bamtools
~/biosoft/Qualimap/qualimap_v2.2.1/qualimap --help
软件安装之后使用非常简单,而且我们只使用它的bamqc的功能命令如下:
~/biosoft/Qualimap/qualimap_v2.2.1/qualimap --java-mem-size=35G bamqc -bam ~/data/project/myGenome/bamFiles/P_jmzeng.final.bam
而且它不需要再对每条染色体分别处理了,因为它本身就自带这个统计机制。至于这个软件做了什么呢,我已经把它的报告上传到网络了,大家可以点击查看原文来了解或者复制链接到浏览器 ( http://www.biotrainee.com/jmzeng/blogMyGenome/P_jmzeng_Qualimap_results/qualimapReport.html ),其实也就是我们前面对bam文件的一些解析而已,没什么意思,讲这两个软件,只是告诉大家,对于生信工作者来说,学习一个新的软件的用法应该是非常简单的事情。
文:Jimmy、吃瓜群众
图文编辑:吃瓜群众