【直播】我的基因组73:在IGV看看indel是啥样子

前面我们特意用scalpel软件来找indel,期待它会有一些出彩的表现,当然我还没来得及比较它找到的INDEL跟GATK等工具区别在哪里,不过我们先在IGV里面看看找出来的是什么吧。

【直播】我的基因组61:scalpel软件找indel

这里我不止一次推荐大家对数据处理结果进行可视化了,可视化能加深我们对处理步骤的理解。

先看看下面这个杂合的1碱基的缺失吧:

可以看到这个位置的测序深度是90X(有点过了,我的全基因组平均测序是45X),有32条reads在这个位置并没有缺失,有58条reads在这个位点缺失了一个碱基,所以它是一个杂合的Delete。它的前后还有两个杂合的SNP。

再看看一个杂合的4个碱基缺失情况:

这个delete处测序深度是22,虽然软件判定是一个杂合的缺失,但是只有3条reads是没有缺失的,另外的19条reads都是缺失了,而且它被标记着要过滤掉,这个就取决于软件的打分机制了。

再看看大片段缺失的情况:

这个不得了啦,一般来说,软件寻找INDEL的时候,不会考虑那些没有被reads覆盖的区域的,首先那些没有被reads覆盖的区域可能的原因多种多样,其次,既然没有被reads覆盖,那么长度肯定是超过reads长度了,也就是150个碱基,而INDEL的一般定义是50个碱基以下的缺失或者插入变异情况。这一个大片段缺失,我其实并不知道该如何解释,有点复杂。

再看看4个碱基的插入情况:

这个很简单了,缺失可以在reads里面显示一个小的空格,而插入呢,不管是插入多少个碱基,统统只能用大写字母I来表示。只有在IGV把鼠标放在具体的reads上面才会显示该reads比对详情。

(0)

相关推荐

  • 二代测序基础知识

    二代测序基础知识 二代测序基础概念 (这个是与二代测序相关每个部门都要掌握的) FQ数据格式 高通量测序(如Illumina HiSeqTM/MiseqTM)得到的原始图像数据文件经CASAVA碱基识 ...

  • (3条消息) gwas snp 和

    上周,我们给大家推送了徐洲更翻译的"SNP过滤教程". 结合SNP这个话题,本小编今天和大家一起探讨下SNP和SNV等相关概念.如有不严谨之处,欢迎温柔拍砖. 相信大家对SNP都不 ...

  • IGV-sRNA,改造出一个适合小RNA分析的基因组浏览器

    写在前面 IGV是我认知范围内,得到最广泛使用的基因组浏览器.作为一个强大的软件,其支持 各种测序数据的可视化,但对于小RNA测序数据的支持,却仍然一般.于是,我对其进行了几次小的修改,完成一个相对适 ...

  • 【直播我的基因组66:大多数性状往往是多个基因控制的

    前面我们说到了那些简单的由单个基因决定的性状,这东西不需要预测,其中的生物学机制已经研究的非常透彻,只要拿到你的基因信息,很容易推断你的性状,比如人的乙醇脱氢酶和乙醛脱氢酶等多种乙醇代谢基因,你本身是 ...

  • 直播我的基因组(第一阶段)完整目录

    最近的全国巡讲不少人问到我两年前的直播基因组系列教程的完整目录,这里先放出直播我的基因组(第一阶段)完整目录.(悄悄告诉你,后台回复直播可以拿到精排版EXCEL表格!)(然后,点击阅读原文也可以拿到可 ...

  • 极市直播回放丨第73期-汤凯华:利用因果分析解决通用的长尾分布问题

    长尾分布是指常见的不均衡数据分布,该问题大大降低了机器学习模型的鲁棒性,并且需要利用高昂的成本去采集罕见数据才能解决.传统的解决方案不仅依赖提前预知未来数据的分布,而且也容易对罕见数据过拟合. 本次分 ...

  • 在YY直播,我看到了明星努力打破内卷的样子

      虽说明星直播早已成为娱乐圈的新常态,但围观群众始终有点雾里看花.隔三差五便会冒出一系列重复的话题:明星和主播是否业务有壁?什么样的艺人适合直播间?播成什么效果才算得上实绩?凡此种种,足以让网友.粉 ...

  • 【直播】我的基因组22:用IGV查看具体某个位点是否变异

    下载IGV和导入文件的方法我就不多说了,可以直接在windows平台下使用,就跟你操作QQ一样,自己摸索就好了! 著名芬兰运动员Eero Mäntyranta,他拿过七枚奥运奖牌.他的血红细胞远超正常 ...

  • 批量IGV截图【直播】我的基因组83

    把我的全基因组重测续数据bam文件载入到IGV看了几个基因,发现有一些基因比对情况非常诡异,各种色块,各种缺口,让我不忍直视,搞得像是个破损的基因组,也查了查那些基因,主要是一些家族性基因,太长的基因 ...

  • 【直播】我的基因组(四):计算资源的准备

    大家久等了,Jimmy的测序数据还没有拿到手!但是,工欲善其事必先利其器!所以jimmy在等待自己基因组的这段时间里,准备好了自己计算资源!鉴于会有不少同志们会跟着直播来自己动手分析一个公共的全基因组 ...

  • 【直播】我的基因组(五):测试数据及参考基因组的准备

    我的全基因组数据还没拿到,而且还会推迟,简单说(tu)明(cao)一下原因(还好当初为了避免广告嫌疑一直没说是哪个公司负责测序,反正用的是illumina的hiseqX10这个测序啦,所以可以尽情的吐 ...

  • 【直播】我的基因组(六):变异位点注释数据库的准备

    大家好,又是一周不见. 这次见面,已然是一个悲伤而又狂欢的日子,这个双十一,小编从一只单身汪已经变成了断手单身汪,累觉不爱.但是,扶朕起来,朕还能学. Jimmy的测序数据终于出来了,虽然还没寄到Ji ...