改造-基因组浏览器-IGV(九)- 快速[t]BlastN结果

写在前面

高通量测序技术普及,大量物种基因组被测序。组装质量逐步提高,但基因结构注释的质量则一如既往的让人担心。错误的基因结构注释,可能会使得你得到错误的结果。比如:

  1. 不准确的基因结构注释,使得编码蛋白集合序列有误,最终导致同义突变位点的错误统计,得到的Ks值有错,于是无法相对正确的估算物种的分化时间;

  2. 不准确的基因结构注释,可能会使你得到的分析结果是某个基因家族的扩张或者收缩,而实际情况是,存在一定的基因没有被正确注释出来

  3. 不准确的基因结构注释,在更严重的情况下,直接会导致你做的所有RNAseq定量出错,于是你无论怎么分析,得到的差异表达基因列表都毫无意义。

  4. 不准确的基因结构注释。。。

总的来说,Garbage in, Garbage out.。
我一如既往地向各位提出,分析中需要注意的各种各样的问题。而不是给出分析流程,送出代码。
我开始觉得,很多人并不值得你去分享你的所做,所知。或者是他们不需要,或者是他们不懂,或者是他们不屑。
可能只有聪明的人才知道,
成功是不能复制的,但是坑是可以躲过的。
你复现再多人的流程,能得到的往往是类似的结果。所以paste code的工作,能让你得到的永远是表面的。
好,说好了不吐槽,然而我还是写了一长串。

今天这个推文的主题是,推出刚才改造的IGV的新的使用姿势。

快速在全基因组查看[t]BlastN结果

Blast,我们大家都很熟悉。IGV,我们也很熟悉。存在不少时候,我们会希望直接在IGV中可视化Blast的结果,这样做的好处有很多。

  1. 看看某个基因或者基因家族在IGV的分布位置,随后结合RNAseq数据进行人工基因结构注释矫正

  2. 看看某条引物可能的错配位置...

  3. 看看其他物种的序列,在当前物种中的位置,结合RNAseq数据或者其他重测序数据,比如你要看看在这里有没有SNP

  4. ....【用途不应该由我来想,而是用户来想】

使用方式与效果

我一贯认为,生物信息到下游,必然是要可视化Inspect。在这种情况下,超短时间内获得可用于可视化的数据,有助于缩短你的分析时间,更重要的是,不会打断你的分析思路。
blastn或者tblastn都可以,感兴趣的各位可以自己命令行操作。而我这里直接使用TBtools,因为这样方便。

所以操作步骤简单:

  1. 设置输入的序列,比如一条蛋白序列

  2. 设置subject为基因组序列

  3. 设置输出文件,注意确保输出结果文件后缀为「.tabblastn」

  4. 点击Start

很快你会得到输出文件,直接从「File」菜单中导入「IGV」即可。

当我们放大这些比对上的位置,可能会看到

可以看到,输入序列比对到四个同一家族的成员,中间的那个,很有可能是错误注释。

可视化基因结构

比如我现在有一个CDS,我可以直接比对到这个region,看看他的基因结构。

图片中,我只做了三步操作:

  1. 点击一下其中一个转录本的形状,这是在IGV改造八中增加的特性,点击一下,直接在剪切板中获得CDS序列,很多人为此抓狂

  2. 黏贴CDS序列到TBtools的Query Seq,其他的不修改

  3. 点击Start,随后载入IGV

我们可以看到,BlastN整体上复现了原来的基因结构,说明还是不错。

不过,一切基于纯粹的文本比较无法100%结构正确,这个问题以前分享过。

写在最后

洋洋洒洒,又是一篇推文。IGV的设计是很不错的。可能IGV的代码也是我看的第一份Java源码,毕竟,我当初是因为从零写了两个基因组浏览器,效果实在是不如IGV才来看他。我天真的以为IGV不会调用太多的第三方包。然而事实正好相反。可能这就是我个人思维的局限吧。
希望各位也明白,很多时候,你不用自己厉害,你身边的人厉害就可以了。
更或者,【是努力?还是机遇?让你走的更高呢?】
这是一个开放的问题,但是也是一个Closed的问题。因为打开展开来说,只会有两种结果:

  1. 鸡汤

  2. 毒鸡汤

那么就到这里,祝各位明日开工大吉。

(0)

相关推荐

  • 二代测序技术中生物信息学的应用

    随着科学技术的巨大进步,产生了大量的"组学"数据.理解生物系统各个层次产生的大量序列和结构数据是关键,由此产生了"生物信息学". "生物信息学&quo ...

  • 9个组织的37个样本的大豆的长非编码RNA的鉴定

    咱们<生信技能树>的B站有一个lncRNA数据分析实战,缺乏配套笔记,所以我们安排了100个lncRNA组装案例文献分享,以及这个流程会用到的100个软件的实战笔记教程! 下面是100个l ...

  • IGV基因组注释文件说明

    IGV基因组注释文件说明

  • 科研 | BMC Genomics:美洲河狸首次全组织lncRNA分析

    编译:寒江雪,编辑:十九.江舜尧. 原创微文,欢迎转发转载. 导读 长链非编码RNA(lncRNA)在基因调控.表观遗传学等方向的研究中发挥着重要作用,也是哺乳动物进化适应的基础.很多哺乳动物由于没有 ...

  • 修改IGV基因组浏览器源码,做一个自己需要的浏览器

    写在前面 从图片来看,即小RNA的reads展示在染色体上,并用长度做可视化.这个需求,其实拿起任何一门语言,手写一个.svg就可以搞定了.只是读取read alignment数据想想比较辛苦.有比较 ...

  • IGV-sRNA,改造出一个适合小RNA分析的基因组浏览器

    写在前面 IGV是我认知范围内,得到最广泛使用的基因组浏览器.作为一个强大的软件,其支持 各种测序数据的可视化,但对于小RNA测序数据的支持,却仍然一般.于是,我对其进行了几次小的修改,完成一个相对适 ...

  • 手机QQ浏览器如何设置快速翻页方式?

    打开手机浏览器,由于屏幕太小,遇到篇幅较长的网页,翻页就是一个比较痛苦的事情,不过手机QQ浏览器可以设置快速翻页,如何设置呢? 什么是快速翻页方式呢?一旦设置以后,就会在页面左侧或者是右侧看到下图所示 ...

  • “旧区改造大决战” 杨浦旧改快速推进的背后

    2月3日傍晚,被称为沈家桥的杨浦区定海154街坊B地块传来好消息,基地启动签约第一天签约率便达到100%.这是2021年杨浦区首个旧改二次征询签约生效的基地. 1月20日,一场名为"旧区改造 ...

  • 一步一步教你用基因组浏览器(图文)

    一.配置参数 UCSC基因组浏览器地址: https://genome.ucsc.edu/cgi-bin/hgTracks?db=mm10&lastVirtModeType=default&a ...

  • ​UCSC基因浏览器 :最早的基因组浏览器

    # UCSC UCSC基因组浏览器是由来自和英国的多机构研究团队University of California Santa Cruz(UCSC)基因组学研究所的跨部门团队Genome Bioinfo ...

  • 用JBrowse搭建基因组浏览器

    写在前面 JBrowse,可以把它理解为一个网站(网页),只不过使用它不再需要从 HTML 和 CSS 写起,也不用 JS 来编写各种 function.其次它的功能是用来展示各种基因信息,比如基因的 ...

  • IGV-sRNA - 植物小RNA测序数据专用基因组浏览器

    如本期推文,我们开始对外共享三年多以来的部分工作成果,即 sRNAanno  - 一个植物小RNA注释数据库 ( www.plantsRNAs.org ).在这个数据库中,用户可以但不仅限于: 下载1 ...

  • 微生物基因组改造技术原理

    一些微生物被应用于工业发酵,生产乙醇.食品及各种酶制剂等.对工业微生物开展的基因组研究,不断发现新的特殊酶基因及代谢过程和代谢产物生成相关的功能基因,可以将其应用于生产以及传统工业.工艺的改造,同时推 ...