16s分析之Qiime质控+去除嵌合体
Qiime质控很快,但是去除嵌合体就不那么迅速了,上次16s分析之Qiime序列拼接没有给出数据和运行界面,可能体验会差一些,这次我给加上;
先说说质控命令:
split_libraries_fastq.py -i input_folder -ooutput_folder
参数设置参照:
-q 该命令是质量控制参数,一般是19,20更好
-p 质量控制要求,默认0.75,
multiple_split_libraries_fastq.py -i lxdjhg_join_zz -o lxdjhg_split --demultiplexing_methodsampleid_by_file -p ./lxdjhg/mel_peir.txt
质控参数文件设置参考:
phred_quality_threshold: 19
下面开始运行:
参数文件我设置、(当然可以根据数据修改):
命令输入:
multiple_split_libraries_fastq.py -i ./gzhcs_join2 -o gzhcs_split--demultiplexing_method sampleid_by_file -p ./mel_peir.txt
下面是运行界面(Terminal输入操命令过多会很繁杂,可以输入clear:清楚当前界面):
结果展示,这条质控命令会将所有分开的文件全部合并在一起,并且序列都会编号好:
去除嵌合体,我们下载一个gold.fa数据库,下载网址:
http:// drive5. com/uchime/gold.fa
另外,我们下载usearch61,下载地址,下载下来修改名称为usearch61:
http://www.drive5.com/usearch/download.html
下面基于对我们的Qiime安装usearch61:
请先进入根目录:
su
界面在password里面输入密码qiime:
将文件复制到/usr/bin/下:
mv ~/Desktop/Shared_Folder/usearch61 /usr/bin/
运行:
sudo chmod +x /usr/bin/usearch61
source ~/.bashrc
即可安装成功输入usearch61,即可显示相关信息:
Qiime上去除嵌合体命令如下:
identify_chimeric_seqs.py -m ChimeraSlayer -i seqs.fna -a/home/qiime/Desktop/gold.fa -o chimeric_seqs_cs.txt
参数参考设置:
-m ChimeraSlayer调用方法,还有usearch61可以使用
两种方法,ChimeraSlayer会很慢,但是usearch61会很快,那种好,我也不好说,但是我一般用usearch61
下面开始输入命令:
identify_chimeric_seqs.py -m usearch61 -i~/Desktop/gzhcs_split/seqs.fna -r /home/qiime/Desktop/Shared_Folder/gold.fa -ogzhcs_usearch61_chimera_checking/
运行界面:
跑完界面文件:
里面的chimeras.txt文件即为嵌合体文件我们运行下一条命令去除这些嵌合体:
下面我们将嵌合体过滤:
filter_fasta.py -f ~/Desktop/gzhcs_split/seqs.fna -oseqs_chimeras_filtered.fna -s /home/qiime/Desktop/gzhcs_usearch61_chimera_checking/chimeras.txt–n
参数简介:
-s 嵌合体序列文件路径
-n去除名单中的序列
命令界面: