lncRNA组装流程的软件介绍之bamCoverage
咱们《生信技能树》的B站有一个lncRNA数据分析实战,缺乏配套笔记,所以我们安排了100个lncRNA组装案例文献分享,以及这个流程会用到的100个软件的实战笔记教程!
bamCoverage是deeptools下的一个工具,主要用于BAM转换为bigWig
deeptools是基于Python开发的一套工具,用于处理诸如RNA-seq, ChIP-seq, MNase-seq, ATAC-seq等高通量数据。工具主要用途:
- BAM和bigWig文件处理
- 质量控制
- 热图和其他描述性作图
- 其他
一、软件安装
使用conda安装
conda install deeptools
二、bamCoverage的用法
安装完成以后,可以使用bamCoverage -h来查看软件的帮助文档。
1. 软件用法:
2.常用参数:
-b # 输入bam文件
-o # 输出
-p # 线程数
-e/--extendReads # 拓展了原来的read长度
-bs/--binSize # 设置分箱的大小
--filterRNAstrand {forward, reverse}: 仅统计指定正链或负链
--region/-r CHR:START:END: 选取某个区域统计
#为了其他结果进行比较,还需要进行标准化,deeptools提供了如下参数:
--scaleFactor: 缩放系数
--normalizeUsing {RPKM,CPM,BPM,RPGC,None}
--normalizeTo1x: 按照1x测序深度(reads per genome coverage, RPGC)进行标准化
--ignoreForNormalization: 指定那些染色体不需要经过标准化
三、输入文件
bam文件
四、软件运行命令
批量运行
ls /home/data/lihe/lncRNA_project/04.mapping/*.bam > 1
ls /home/data/lihe/lncRNA_project/04.mapping/*.bam | cut -d "/" -f 7 | cut -d "_" -f 1 | cut -d "." -f 1 > 0
paste 0 1 > config
cat > bw.sh
config=$1
number1=$2
number2=$3
cat $1 | while read id
do
if((i%$number1==$number2))
then
arr=(${id})
input=${arr[1]}
sample=${arr[0]}
bamCoverage -p 2 -b ${input} -o ./${sample}.bw
fi ## end for number1
i=$((i+1))
done
for i in {0..4}
do
(nohup bash bw.sh config 5 $i 1>log.$i.txt 2>&1 & )
done
命令参数解读:
-p 2 # 设置线程数为
-b ${input} # 输入bam文件
-o ./${sample}.bw # 输出文件
五、结果解读
输出文件为bw文件
bigWig是wig或bedGraph的二进制版,存放区间的坐标轴信息和相关计分(score),主要用于在基因组浏览器上查看数据的连续密度图,可用`wigToBigWig`从wiggle进行转换。
为什么要用bigWig?
主要是因为BAM文件比较大,直接用于展示时对服务器要求较大。因此在GEO上仅会提供bw,即bigWig下载,便于下载和查看
文末友情推荐
与十万人一起学生信,你值得拥有下面的学习班: