技能| KEGG代谢通路注释图:绘制流程5分钟看懂

01

KEGG背景

KEGG是一个整合了基因组、化学和系统功能信息的数据库。
与其他数据库相比,KEGG 的一个显著特点就是具有强大的图形功能,它利用图形而不是繁缛的文字来介绍众多的代谢途径以及各途径之间的关系。
这样可以达到以下两个层面的信息:
一,如果从功能出发,我们研究功能到通路到基因,达到迅速锁定某些功能的基因;
二,从基因出发,我们获得某个基因在信号通路中的角色(上下游关系)和生物学功能。

ko:表示通路,这个通路是不分物种的,相当于所有物种某一通路的并集。

KO(KEGG Orthology):是KEGG中一个“专有名词”,表征一个基因。KO作为ko通路中的基本单位,它是蛋白质(酶)的一个分类体系。通常序列高度相似且在同一通路中具有相似功能的蛋白质被归为一组,即一个KO。

总之,KEGG是科研过程中必不可少的工具之一,它用形象的图形使我们直观地对某一个基因有了一个由点及面的印象,有利于我们把握科研过程中的全局观,本文介绍详实,建议收藏。

02

KEGG代谢通路怎么看

在KEGG分析结果中,需要分清例如K01000和ko01000这样的编号的生物学意义:

K01000:由大写K+五位数字组成,对应的是KEGG数据库中某类蛋白的编号,即某些基因注释到了该蛋白,该编号代表着这一类功能的蛋白,一个基因对应一个这种大K编号;

ko01000:由小写的ko+五位数字组成,是pathway的编号,对应的是某一条代谢通路;一条通路里可以有多个基因共同参与调控,所以会存在多个大K编号,同样,一个基因也可以参与多个代谢通路,所以一个基因也可以有多个ko注释。

代谢通路中其它各种符号标识 :

M+ num:模块名称

C+ num:化合物名称

E-,-,-,-:酶名称

R + num : 反应名

RC+ num :反映类型

RP+num:反应物对

图例作用关系:

03

在线绘制KEGG代谢通路注释图

为大家推荐一个可以在线绘制KEGG代谢通路注释图的方法——网页版Pathview。
Pathview本是一个通路可视化友好的R包,支持多组学数据映射(基因/蛋白-代谢)。Pathview有一个网页版(https://pathview.uncc.edu/),这对于非生信同学来说是极其方便的!

数据准备:以6个人的转录组数据为例,我们感兴趣的是某一分组中与MAPK signaling pathway有关的基因,于是我们从该组差异基因列表中筛选出目标基因及FPKM值,如下表。

Pathview数据文件格式需以tab或者逗号分隔的txt或者csv文件,EXCEL数据可以通过另存为(制表符分隔)TXT文件格式或者CSV(逗号分隔)文件。

数据提交与选项设置:如下图:点击New Analysis进入分析页面,首先在input&output下提交数据,Gene Data项选择文件上传数据。

数据上传完页面会自动跳出样本分组对话框,如下图:箭头处填写样本顺序号,并用逗号隔开即可分组,完成后点击Close关闭对话框。

接下来需要选择参考基因及数据类型等,参考基因选择人类参考基因组,转录组分析时参考基因组来源于ensembl,所以基因ID类型选择ENSEMBL,其他数据按实际情况自行选择。

需要注意的是步骤③,Manual选项下,可以手动选择感兴趣的通路,此处也可以选择Auto,数据库会自动给出能注释到的所有通路结果。

步骤④在左侧选择感兴趣的通路,选中,点击⑤即可添加到右侧。选项Graphics,即图形参数,无特殊需求可默认;选项Coloration是颜色设置,可按需调整。

以上操作完成点击Submit提交任务。

结果展示:Pathview绘图速度很快,如下图,绘制完成后,进度条位置便会出现结果查看链接。

下图是生成的MAPK signaling pathway注释结果,点击链接即可查看绘图:

这样,我们感兴趣的基因的kegg注释图就完成绘制了!Pathview支持上百种有参物种,适用性很广,感兴趣的话赶紧试一下吧!

信息来源:https://www.jianshu.com/p/f90ed1c52079、组学大讲堂等

本文所有内容及图片未做商业用途,如有版权问题可联系下方小助理,及时处理~

(0)

相关推荐