8 比对及找变异步骤的质控

使用qualimap对wes的比对bam人家总结测序深度和覆盖度ls -lh *raw.vcf-rwxrwxrwx 1 root root 184M Jun 7 10:58 SRR7696207_raw.vcf-rwxrwxrwx 1 root root 61M Jun 7 09:39 SRR8517853_raw.vcf-rwxrwxrwx 1 root root 87M Jun 7 03:04 SRR8517854_raw.vcf-rwxrwxrwx 1 root root 331M Jun 7 02:21 SRR8517856_raw.vcf1 比对的各个阶段的bam进行质控可以把中间生成的.bam文件删除,就是带marked的bam文件rm *_marked*.bamls *.bam |xargs -i samtools index {} ls *.bam | while read id ;do (samtools flagstat $id > $(basename $id ".bam").stat);donecat SRR7696207.stat55398860 + 0 in total (QC-passed reads + QC-failed reads)0 + 0 secondary372636 + 0 supplementary0 + 0 duplicates55374129 + 0 mapped (99.96% : N/A)55026224 + 0 paired in sequencing27513112 + 0 read127513112 + 0 read254512924 + 0 properly paired (99.07% : N/A)54978908 + 0 with itself and mate mapped22585 + 0 singletons (0.04% : N/A)330146 + 0 with mate mapped to a different chr252082 + 0 with mate mapped to a different chr (mapQ>=5)安装bedtoolsconda install -c bioconda bedtools制作exon.bed文件cat /mnt/f/kelly/bioTree/server/wesproject/hg38/annotation/CCDS.20160908.txt |perl -alne '{/\[(.*?)\]/;next unless $1;$gene=$F[2];$exons=$1;$exons=~s/\s//g;$exons=~s/-/\t/g;print "$F[0]\t$_\t$gene" foreach split/,/,$exons;}'|sort -u |bedtools sort -i |awk '{print "chr"$0"\t0\t+"}' > /mnt/f/kelly/bioTree/server/wesproject/align/hg38.exon.bed查看cat hg38.exon.bed |headchr1 69090 70007 OR4F5 0 +chr1 450739 451677 OR4F29 0 +chr1 685715 686653 OR4F16 0 +chr1 925941 926012 SAMD11 0 +chr1 930154 930335 SAMD11 0 +chr1 931038 931088 SAMD11 0 +chr1 935771 935895 SAMD11 0 +chr1 939039 939128 SAMD11 0 +chr1 939274 939459 SAMD11 0 +chr1 941143 941305 SAMD11 0 +qualimap进行质控align文件夹ls *_bqsr.bam | while read id;dosample=${id%%.*}echo $samplequalimap bamqc --java-mem-size=8G -gff hg38.exon.bed -bam $id & donealign下新建stats文件夹,把stat文件都移动到里面mkdir statsmv *stat stats/ls -lh stats/显示如下total 0-rwxrwxrwx 1 root root 453 Jun 7 16:31 SRR7696207_bqsr.stat-rwxrwxrwx 1 root root 447 Jun 7 16:29 SRR7696207.stat-rwxrwxrwx 1 root root 444 Jun 7 16:34 SRR8517853_bqsr.stat-rwxrwxrwx 1 root root 444 Jun 7 16:33 SRR8517853.stat-rwxrwxrwx 1 root root 447 Jun 7 16:37 SRR8517854_bqsr.stat-rwxrwxrwx 1 root root 447 Jun 7 16:35 SRR8517854.stat-rwxrwxrwx 1 root root 452 Jun 7 16:43 SRR8517856_bqsr.stat-rwxrwxrwx 1 root root 452 Jun 7 16:40 SRR8517856.stat完成后会生成SRR8517856_bqsr_stats类似的文件夹现在建立一个qualimap文件夹,把上面这种文件夹都移动到里面mkdir qualimapmv *_stats qualimapcd qualimapls -lhtotal 0drwxrwxrwx 0 root root 4.0K Jun 7 17:41 SRR7696207_bqsr_statsdrwxrwxrwx 0 root root 4.0K Jun 7 17:58 SRR8517853_bqsr_statsdrwxrwxrwx 0 root root 4.0K Jun 7 18:03 SRR8517854_bqsr_statsdrwxrwxrwx 0 root root 4.0K Jun 7 17:41 SRR8517856_bqsr_stats然后做multiqcmultiqc ./查看

multimap_multiqccoverage不够,不知是我操作哪步有问题还是?然后在stats文件夹下执行multiqc命令multiqc ./然后把得到的├── [4.0K] multiqc_data│ ├── [ 261] multiqc_general_stats.txt│ ├── [7.3K] multiqc.log│ ├── [2.2K] multiqc_samtools_flagstat.txt│ └── [ 882] multiqc_sources.txt├── [1.0M] multiqc_report.html下载到本地电脑查看。

stats_multiqc

(0)

相关推荐

  • sam转为bam文件报错

    怕什么报错呢,重来一次不就好了吗! 学员群有人提问,他们上完了我们的转录组课程,自己拿服务器去跑一个文献数据,有一个样本的sam转为bam文件报错,得到文件如下: 213M 2月  20 20:59  ...

  • m6A图文复现02-数据下载和质控

    但很多粉丝留言表示这些英文教程看不懂,数据也很分散,没有中文解说实在是很难跟下来,希望我们出一个手把手系列教程. 这个全套 MeRIP-seq 图表复现代码在GitHub:https://github ...

  • 软件介绍之Samtools

    咱们<生信技能树>的B站有一个lncRNA数据分析实战,缺乏配套笔记,所以我们安排了100个lncRNA组装案例文献分享,以及这个流程会用到的100个软件的实战笔记教程! 下面是100个l ...

  • qualimap+multiqc完美解决多组学比对结果的质控

    这个完全是项目实战经验分享咯,有大样本量NGS多组学数据处理经验的朋友应该能很容易理解,动辄几个T的数据,上百个样本很难一个个的检查是否出现问题,需要一个简单方便快捷质控方案.而我认为qualimap ...

  • ChIP-Seq数据分析上下游打通

    连续两次求贤令:曾经我给你带来了十万用户,但现在祝你倒闭,以及 生信技能树知识整理实习生招募,让我走大运结识了几位优秀小伙伴!大家开始根据我的ngs组学视频进行一系列公共数据集分析实战,其中一个小伙伴 ...

  • ChIP-seq数据分析课程学习笔记之 测序数据质量控制和比对

    咱们<生信技能树>的B站有一个ChIP-seq数据分析实战视频课程,缺乏配套笔记.恰好前些天的求贤令:曾经我给你带来了十万用户,但现在祝你倒闭,走大运结识了几位优秀小伙伴! 其中中国医科大 ...

  • 【直播】我的基因组53:几个找变异的软件的效果比较

    随便找一个SNP-calling的综述就可以找到一大堆软件的评价,我这里强烈推荐A survey of tools for variant analysis of next-generation ge ...

  • 如何对多个转录组测序数据找变异呢

    以前生信技能树发过这个教程: RNA-seq 检测变异之 GATK 最佳实践流程 第一次对参考基因组建索引 然后进行第一次序列比对 之后根据第一次比对得到的所有剪切位点,重新对参考基因组建立索引 再进 ...

  • 最新版针对RNA-seq数据的GATK找变异流程

    RNA-seq标准分析,我们已经讲解的太多了,表达矩阵到差异分析等下游生物学注释都没有啥新颖之处,融合基因和可变剪切算是出彩的地方,如果加上GATK找变异流程就更棒了,反正都使用了star软件进行序列 ...

  • 明码标价之WES等DNA测序数据找变异

    最近有粉丝在我们<生信技能树>公众号后台付费求助,想重新分析一下某肿瘤队列文献的数据,需要下载几个T的fq数据走比对流程,然后找SNV和CNV等变异. 因为他的课题是保密的,我这里不方便提 ...

  • 八字找夫妻星的步骤 看婚姻运势如何

    八字找夫妻星的步骤 看婚姻运势如何 婚姻运势对于想要结婚的男女来说是十分重要的,通常想要测算都是通过自身八字命格看出将来婚后将会过上怎样的生活,若是出现一些对于婚礼不利的情况发生,也可以从中找出解决的 ...

  • 电话销售找对人的7个步骤

    做好电话销售的首要条件是什么,那就是要找对人.如果电话销售人员在销售过程中始终在和不正确的人在对话,即使你其他方面做的很到位,你也不会有好的业绩.下面给大家介绍一下在电话销售过程中如何去找对人,希望能 ...

  • 5 一步法找基因变异流程

    5 一步法找基因变异流程

  • 如何从头到尾找一个女朋友?详细步骤,男生照着做

    找女朋友?这件事情说难也不难,说不难也难,关键只在于三个字"执行力". 这个世界上,只要有正确的方法,加上良好的执行力,就可以办成绝大多数的事情. 方法,接下来我会分享给大家,执行 ...

  • 隐藏的文件怎么找出来 找出隐藏的文件方法和步骤介绍【图文】

    随着信息技术和网络科技的进步,人们的生活.工作以及学习等各项活动都越来越离不开电脑.对于经常使用电脑的朋友们来说,在电脑中创建文件是一项最基本的技能之一.但是,很多情况下,我们所创建或者书写的文件属于 ...