引导式答疑启发学员理解生信软件的参数选择和阈值调整(南京站学员分享)

全国巡讲的步伐迈入了近20个城市,发现南京站的学员们踊跃分享学习成果,我也很纳闷,是做对的什么才带领了这股风潮呢?以前大家都是蒙头学会了就ok了,这次大家表现的都想要加入生信技能树创作团队!

前些天一个学员分享的是:文章测序数据下载碰到的问题的小总结(南京站学员分享)

这次让我们看看另外一个优秀学员的笔记:

一周前参加了生信技能树的南京站培训,回来时刚好有一批高通量二代测序的数据需要处理,师姐说学以致用正好可以练练手。仔细了解了一下我们的数据是来自测序公司的raw data,我需要做的就是处理成clean data才能进行下一步分析。

回顾了课程内容,发现刚好对应原始数据的质量控制这一部分,包括测序质量统计和质量控制。打算看几遍流程和示例代码之后直接上手。不过在示例代码里发现有一个参数的值不是很明白不知道怎么修改。

生信技能书示例代码

--length参数表示小于设定值的序列会被修剪,在示例代码里给的值是36,不太明白这个值是怎么来的,难道有什么规则?带着疑问在群里咨询了一下,jimmy老师并没有直接解释,而是让我自己去看一下--length参数的默认值,引导我自己去解决问题(非常非常赞)。

首先我通过man查询了trim_galore软件的详细信息发现--length的信息出现了两次有两个默认值,前者默认值是20bp表示默认小于20bp的read会被修剪掉。在老师的提醒下发现后者(参数前面有-r1-r2)指的是当一对read只剩下一个时保留的最小长度,默认值是35bp。但是我还是不太明白为什么示例是36bp,我再次提问,才了解到原来36是老师自己选的,其实和默认值差异不大。

参数详情1
参数详情2

为了让我理解差异的大小,按着老师的建议我分别把--length的设定值选成30bp、35bp、36bp和50bp并查看经过trim_galore软件处理后的qc差异,结果如下。

设定值30bp
设定值35bp
设定值36bp
设定值50bp

从结果可以看到总序列数上设定值35/36的差异很小,按老师的话来讲其实数据处理的设定值没有标准答案,只要清楚自己的目的就行。最后为了放心我分别拿设定值为35bp和36bp的结果做下游分析,结果上完全一样!(我们是用建库后用高通量来做突变体基因型鉴定的,我的目标序列长度都大于我的设定值)

老师的引导式答疑真的很赞,这个过程收获很多,非常感谢~

(0)

相关推荐

  • Range.TextToColumns 方法 (Excel) | Microsoft Docs

    Range.TextToColumns 方法 (Excel) 2019/04/19 o 将包含文本的一列单元格分解为若干列. 语法 表达式.TextToColumns(Destination. Dat ...

  • 用Calypso在线绘制热图、树状图及Krona图

    用Calypso在线绘制热图、树状图及Krona图

  • 生信菜鸟团博客2周年精选文章集(6)三个最基础生信软件教程

    其实我现在已经不写软件教程了! fastqc对原始测序reads质控 NCBI的blast++软件使用说明书 SRA工具sratoolkit把原始测序数据转为fastq格式 目录 一:下载安装该软件 ...

  • 视频讲解-R爬取生信软件列表到思维导图

    视频见文末,阅读原文更有惊喜大礼包,希望你听完我的视频,也能制作下面的思维导图!!! 了解并安装R 下载R语言的软件:https://cran.r-project.org/bin/windows/ba ...

  • 生信小技巧系列第一季完结版视频教程学习笔记分享

    专题历史目录: 3个学生的linux视频学习笔记 生信人应该这样学R语言系列视频学习心得笔记分享 一万人陪你学习GEO数据库挖掘知识(公益视频听课笔记分享) 公共数据库挖掘视频学习心得体会 接下来介绍 ...

  • conda管理生信软件一文就够

    conda下载miniconda安装miniconda配置镜像创建小环境查看小环境进入小环境查找软件安装软件指定软件安装版本更新软件查看已安装软件退出小环境移除小环境其他注意内容pip安装minico ...

  • 生信入门课全国巡讲2019收官--长沙站

    据不完全统计,在生信技能树/生信菜鸟团的1.3万篇教程,至少有1427篇数据分析实战教程直接或者间接的帮助学员获得工作岗位,完成项目,找到课题,或者搞定基金/SCI文章!我们有一个梦想,把生物信息学技 ...

  • 没有docker我真的不想动这样的生信软件

    看到群里有人咨询TCGA数据库御用的SNP6.0芯片的CNV数据的分析软件,GISTIC2如何安装和使用.让我想起来五六年前安装它的恐惧,有必要系统性整理一下,并且实名羡慕一下 现在的小朋友们,安装软 ...

  • conda与bioconda解决生信软件安装困扰

    简介 conda原本是为了解决Python模块安装的依赖问题,然而可能是无心栽柳柳成荫,conda目前已经超越了其最初目的而存在,可以解决大多数软件的安装和配置,包括各种本身与python毫无关系的包 ...

  • 生信软件安装神器 Mamba [conda加速器~]

    导言 来自师妹的投稿,几年前,生物信息数据分析,一个最大的问题即生物信息学软件安装.但现在绝大多数安装问题都可以通过使用conda,一键解决.如果要挑 conda 的毛病,那么就是速度不够快.于是就有 ...

  • 终极奥义! 生信软件安装神器~ conda 从入门到精通

    前言 生物信息学分析常常需要用到许多不同的软件,常见安装方式有三种: 源码安装,要求安装者对包有较充分的认识,适用于开发者或深入学习和挑战者: 预编译版本安装,一般安装者将其拷贝到目录下即可运行: 第 ...