【直播】我的基因组 43：简单粗糙的WGS数据分析流程

2024-07-28 18:55:45

前面我们扯到bam文件的各种操作，vcf文件的各种操作，基础知识不牢固的同学可能已经云里雾里了。这次我们来讲一个简单的。就是拿到了fastq的测序数据，如何把全基因组分析给跑一遍。(不谈细节！)

首先就是fastq文件比对到参考基因组变成sam文件：

head -40 read1.fq >tmp/read1.fq head -40 read2.fq >tmp/read2.fq ~/biosoft/bwa/bwa-0.7.15/bwa mem -t 20 -M ~/reference/index/bwa/hg19 read1.fq read2.fq| samtools sort -O bam -o jmzeng.sorted.bam

一个简单的管道即可，如果管道不能确认是对的，就像我上面那样先拿一个小本文文件测试一下。由下图可以看到我们sort的bam文件不是按照染色体的1,2,3排序，而是按照chr10,chr11,,,,chr1,,chr2这样的顺序，这个对很多其它软件会不友好。

不过没关系，我们不跑GATK，这个bam文件足够了！

事实上，对我们真实的WGS数据来说，这一步耗时很严重的！(时间开销在后面)

第二个步骤，就是call variation咯，下面两个软件都可以，用起来也很简单。

：

samtools mpileup -ugf ~/reference/genome/hg19/hg19.fa jmzeng.sorted.bam |bcftools call -vmO z -o jmzeng.bcftools.vcf.gzhead -40 read1.fq >tmp/read1.fq ~/biosoft/freebayes/freebayes/bin/freebayes -f ~/reference/genome/hg19/hg19.fa jmzeng.sorted.bam >jmzeng.freebayes.vcfhead -40 read2.fq >tmp/read2.fq

赞 (0)

教程 | 简单粗暴的叶绿体基因组 SNP Calling 流程

写在前面最近主要忙一些植物群体基因组数据的项目.前面提过,赶时间,全基因组的 SNP Calling 使用 GATK 流程,还是需要跑上两三天.但这个还是耗时,并不一定能够赶上工期.于是我将目标转移 ...
如何下载生物数据（三）：GATK数据下载

来源地址:https://blog.csdn.net/xxxie_/article/details/100111991 欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘! 基因学苑Q群:3279872 ...
NGS数据分析实践：06. 数据预处理 - 序列比对+PCR重复标记+Indel区域重比对+碱基质量重校正

NGS数据分析实践:06. 数据预处理 - 序列比对+PCR重复标记+Indel区域重比对+碱基质量重校正目录 1. 序列比对 1.1 参考基因组建索引 1.2 序列比对 2. 排序 3. PCR重 ...
4 比对到参考基因组输出bam文件

进到align目录对质量好的测序数据进行比对 1. 一个个比对,生成BAM文件 align目录 sample=SRR7696207 bwa mem -t 2 -R "@RG\tID:$sa ...
比对软件-Bowtie2

bowtie2 语法很重要!!!! Usage: bowtie2 [options]* -x <index> {-1 <m1> -2 <m2> | -U <r ...
【直播】我的基因组27-先简单统计一下全基因组变异情况吧

在这之前我们已经对VCF格式记录的变异文件有了初步了解,那么接下来我们就实战一下,凭自己的理解来对VCF文件中的内容做一个简单的统计. 我们提到过VCF文件的第八列是比较复杂的,但是它具体信息在VCF ...
【直播我的基因组66：大多数性状往往是多个基因控制的

前面我们说到了那些简单的由单个基因决定的性状,这东西不需要预测,其中的生物学机制已经研究的非常透彻,只要拿到你的基因信息,很容易推断你的性状,比如人的乙醇脱氢酶和乙醛脱氢酶等多种乙醇代谢基因,你本身是 ...
直播我的基因组（第一阶段）完整目录

最近的全国巡讲不少人问到我两年前的直播基因组系列教程的完整目录,这里先放出直播我的基因组(第一阶段)完整目录.(悄悄告诉你,后台回复直播可以拿到精排版EXCEL表格!)(然后,点击阅读原文也可以拿到可 ...
欢聚时代季报图解：虎牙直播营收1.43亿同比增长67.7%

雷帝网雷建平 8月18日报道欢聚时代(Nasdaq:YY)今天发布财报.报告显示,欢聚时代第二季度净营收为19.808亿元(约合2.980亿美元),比上年同期的13.572亿元增长45.9%: 欢 ...
开发直播源码APP最简单的方式居然是选择对的它

对直播源码APP来说,似乎开发价格成为现在客户普遍拒绝开发或换一家开发的主要原因,直播源码APP的价格决定因素多种多样,其中最重要的是源码的开源性.版权.以及开发的功能. 为了避免开发的复杂程度,很多 ...
国球|CCTV5直播乒联总决赛，4-3打哭张本智和，樊振东马龙许昕强势冲冠

CCTV5直播乒联总决赛,4-3打哭张本智和,樊振东马龙强势冲冠北京时间11月20日,2020年国际乒联年度总决赛进入到第二个比赛日.男单方面,首个比赛日,樊振东.马龙.许昕轰出3个4-0晋级,林高 ...
简单粗糙元代建筑风格——永乐宫

永乐宫内分三道轴线,在500米的中轴线上自前至后排列着山门.龙虎殿.三清殿.纯阳殿.重阳殿.除山门为清代建筑外,其余四座均为元代原物.它们在建筑结构和形制上,不仅继使用了宋代"营造法式&qu ...
USEARCH — 最简单易学的扩增子分析流程(中国总代理)

USEARCH -- 最简单易学的扩增子分析流程 USEARCH官方英文主页:http://www.drive5.com/usearch/ 本站经USEARCH作者Robert Edgar授权,由&l ...
红豆杉盆景：简单的制作、养护流程

在市场购买有形态的红豆杉树桩后,我们可以按照下列方法,来制作盆景.简单详细的流程如下: 1.选盆其实制作盆景的时候,选择合适的花盆来制作还是很重要的.那用来栽种红豆杉的花盆,通常情况选择体积较大的, ...