基因集合可视化---如何更优雅、快速、方便而全面?
很多时候,一图胜千言,故还是先放一张结果图片
为什么写?
写这个工具,主要是为了课题需要...当然主要也是为了方便。
这个工具,比较有趣,一个图片主要是有三部分,这也意味着,这三部分的信息是相对独立,但当然也是有所联系。
之前写过三个工具,分别是:
MEME/MAST的motif可视化
pfam/NCBI CDD结构域可视化
基因结构可视化(可以融合2.中的结构域信息)
整体上,用的朋友还是有一些,但是这些工具存在几个问题:
图片的配色比较丑,只适合少量的结构域展示
图片的交互不足,只能是圆形,不能改变形状(如果某个结构域,我希望展示为圆形)
图片缩放时,字体不会自动缩放
....不够自由
....!!!! 竟然需要自己拼进化树,对齐耗时
.....
写成咋样?
既然我也受不了了,那么,还是要重写一个的。这个新的工具有几个特点:
整个图形是可以随意缩小变大,左右上下调整
可以单独做简单的Newick 字符串的 进化树可视化
可以单独可视化MEME/MAST结果,即取代先前的工具之一
可以单独可视化基因结构,即取代先前的另一个工具
不可能单独可视化pfam/CDD结果....即我忘记写了...,但是可以将这个信息融合到基因结构中,信息会全面
可以一次展示上面 1. 2. 3. 4. 的几个信息....,即或许这个才是重点
怎么用?
使用这个工具,可能需要有一些使用先前三个工具的经验,当然,其实也很简单,只是我不会专门介绍,如何获得哪些文件,有需要的朋友,请参考,微信先前推文:
MEME/MAST的使用与图片重绘
NCBI CDD结构域可视化教程
使用pfam批量输出Domain图片
如何快速而自由地绘制一张好看的基因结构图
亦即,如果不知道如何获得输入数据,请直接参考以上四篇图文教程。
使用图解
首先是打开TBtools
如果只是简单展示进化树
如果要同时展示MEME/MAST的结果,那么
如果还要同时展示基因结构(由于需要计算整个gff3的坐标,考虑到GFF3的各类混杂,请在64位操作系统的电脑上运行)
那么会得到这么一张图
如果有一些结构域信息要在基因结构上做标记,比如pfam/CDD的输出结果
于是会得到这么一张图
但是其中名字还是基因组原始编号,很多时候,我们是需要自己命的基因名字,如
那么这样,你就会得到一张名字替换好的图片
以上每个部件都可以单独运行,也还有很多用法,篇幅和精力有限,无法展开。
请注意,三个区块+一个Legend一共是四个Panel,鼠标点击Panel的空白处之后,可以
改变Panel的大小
拖拽移动panel的位置
比如
也可改变形状(然而我发现,似乎这个功能没啥用....),可能切换颜色会有趣些
如何下载最新版的TBtools?
TBtools使用交流群 (553679029)
Omicshare论坛-(近日更新,今天是周六)
差点忘了说,这些天我在TBtools的修改上,做了一次比较大的妥协,具体可能用过前面版本的朋友就会知道....
写在最后
这篇推文可能会有新的读者,想想还是放一个公众号二维码