基因集合可视化---如何更优雅、快速、方便而全面?

很多时候,一图胜千言,故还是先放一张结果图片

为什么写?

写这个工具,主要是为了课题需要...当然主要也是为了方便。
这个工具,比较有趣,一个图片主要是有三部分,这也意味着,这三部分的信息是相对独立,但当然也是有所联系。
之前写过三个工具,分别是:

  1. MEME/MAST的motif可视化

  2. pfam/NCBI CDD结构域可视化

  3. 基因结构可视化(可以融合2.中的结构域信息)

整体上,用的朋友还是有一些,但是这些工具存在几个问题:

  • 图片的配色比较丑,只适合少量的结构域展示

  • 图片的交互不足,只能是圆形,不能改变形状(如果某个结构域,我希望展示为圆形)

  • 图片缩放时,字体不会自动缩放

  • ....不够自由

  • ....!!!! 竟然需要自己拼进化树,对齐耗时

  • .....


写成咋样?

既然我也受不了了,那么,还是要重写一个的。这个新的工具有几个特点:

  1. 整个图形是可以随意缩小变大,左右上下调整

  2. 可以单独做简单的Newick 字符串的 进化树可视化

  3. 可以单独可视化MEME/MAST结果,即取代先前的工具之一

  4. 可以单独可视化基因结构,即取代先前的另一个工具

  5. 不可能单独可视化pfam/CDD结果....即我忘记写了...,但是可以将这个信息融合到基因结构中,信息会全面

  6. 可以一次展示上面 1. 2. 3. 4. 的几个信息....,即或许这个才是重点

怎么用?

使用这个工具,可能需要有一些使用先前三个工具的经验,当然,其实也很简单,只是我不会专门介绍,如何获得哪些文件,有需要的朋友,请参考,微信先前推文:

  1. MEME/MAST的使用与图片重绘

  2. NCBI CDD结构域可视化教程

  3. 使用pfam批量输出Domain图片

  4. 如何快速而自由地绘制一张好看的基因结构图

亦即,如果不知道如何获得输入数据,请直接参考以上四篇图文教程。

使用图解

首先是打开TBtools

如果只是简单展示进化树

如果要同时展示MEME/MAST的结果,那么

如果还要同时展示基因结构(由于需要计算整个gff3的坐标,考虑到GFF3的各类混杂,请在64位操作系统的电脑上运行)

那么会得到这么一张图

如果有一些结构域信息要在基因结构上做标记,比如pfam/CDD的输出结果

于是会得到这么一张图

但是其中名字还是基因组原始编号,很多时候,我们是需要自己命的基因名字,如

那么这样,你就会得到一张名字替换好的图片

以上每个部件都可以单独运行,也还有很多用法,篇幅和精力有限,无法展开。
请注意,三个区块+一个Legend一共是四个Panel,鼠标点击Panel的空白处之后,可以

  1. 改变Panel的大小

  2. 拖拽移动panel的位置
    比如

也可改变形状(然而我发现,似乎这个功能没啥用....),可能切换颜色会有趣些

如何下载最新版的TBtools?

TBtools使用交流群 (553679029)
Omicshare论坛-(近日更新,今天是周六)

差点忘了说,这些天我在TBtools的修改上,做了一次比较大的妥协,具体可能用过前面版本的朋友就会知道....

写在最后

这篇推文可能会有新的读者,想想还是放一个公众号二维码

(0)

相关推荐