实用 | 优雅地提取部分基因结构注释信息

写在前面

很久很久以前,我就已经写过 GFF3/GTF 注释信息的部分提取功能。每一个GXF文件,往往包含的两万个左右基因(数万个转录本)的外显子,CDS等信息。而我们一般感兴趣的,常常只是其中的一些基因或转录本。
绝大多数情况,用户提取这部分基因的结构注释信息,目的在于进行基因结构可视化。但在 TBtools 里面,用户只需要直接提供:1)进化树文本;或者 2)基因 ID 列表就可以直接可视化。进行注释信息提取的步骤,看起来只是多余。于是我一直以来,并不开放这个功能。尽管在极少数的情况下,我发现,其实我也需要稍微提取一下。
既然如此,那就开放这个功能:GXF Select。

GXF Select 的使用

打开 TBtools 并跳转对应的功能。

注意版本号,这个功能才更新的

具体实例

顺便来一个有误的实例,我们看基因结构的时候,往往关注的只是一个代表性转录本的外显子和内含子结构。而非基因,因为一个基因对应多个转录本,每一个转录本各有自己的结构。
有时候,我们可能会用错 ID ,比如

写在最后

Emmm... 至此,我自认为,在 GFF3 或者 GTF 文件操作上,TBtools 的功能确实已经极其丰富,也可以满足 99% 的日常需求。今天更新的这个功能,其实常常会有人提及,但我今天才想好放出来,主要原因,或许是妥协。
妥协和放弃,常常我们换个角度来看,可能会让自己过得更开心一些,尽管不一定是好事,但也不一定是坏事。

(0)

相关推荐