技能| KEGG代谢通路注释图:绘制流程5分钟看懂
01
KEGG背景
ko:表示通路,这个通路是不分物种的,相当于所有物种某一通路的并集。
KO(KEGG Orthology):是KEGG中一个“专有名词”,表征一个基因。KO作为ko通路中的基本单位,它是蛋白质(酶)的一个分类体系。通常序列高度相似且在同一通路中具有相似功能的蛋白质被归为一组,即一个KO。
总之,KEGG是科研过程中必不可少的工具之一,它用形象的图形使我们直观地对某一个基因有了一个由点及面的印象,有利于我们把握科研过程中的全局观,本文介绍详实,建议收藏。
02
KEGG代谢通路怎么看
在KEGG分析结果中,需要分清例如K01000和ko01000这样的编号的生物学意义:
K01000:由大写K+五位数字组成,对应的是KEGG数据库中某类蛋白的编号,即某些基因注释到了该蛋白,该编号代表着这一类功能的蛋白,一个基因对应一个这种大K编号;
代谢通路中其它各种符号标识 :
M+ num:模块名称
C+ num:化合物名称
E-,-,-,-:酶名称
R + num : 反应名
RC+ num :反映类型
RP+num:反应物对
图例作用关系:
03
在线绘制KEGG代谢通路注释图
数据准备:以6个人的转录组数据为例,我们感兴趣的是某一分组中与MAPK signaling pathway有关的基因,于是我们从该组差异基因列表中筛选出目标基因及FPKM值,如下表。
Pathview数据文件格式需以tab或者逗号分隔的txt或者csv文件,EXCEL数据可以通过另存为(制表符分隔)TXT文件格式或者CSV(逗号分隔)文件。
数据提交与选项设置:如下图:点击New Analysis进入分析页面,首先在input&output下提交数据,Gene Data项选择文件上传数据。
数据上传完页面会自动跳出样本分组对话框,如下图:箭头处填写样本顺序号,并用逗号隔开即可分组,完成后点击Close关闭对话框。
接下来需要选择参考基因及数据类型等,参考基因选择人类参考基因组,转录组分析时参考基因组来源于ensembl,所以基因ID类型选择ENSEMBL,其他数据按实际情况自行选择。
需要注意的是步骤③,Manual选项下,可以手动选择感兴趣的通路,此处也可以选择Auto,数据库会自动给出能注释到的所有通路结果。
步骤④在左侧选择感兴趣的通路,选中,点击⑤即可添加到右侧。选项Graphics,即图形参数,无特殊需求可默认;选项Coloration是颜色设置,可按需调整。
以上操作完成点击Submit提交任务。
结果展示:Pathview绘图速度很快,如下图,绘制完成后,进度条位置便会出现结果查看链接。
下图是生成的MAPK signaling pathway注释结果,点击链接即可查看绘图:
这样,我们感兴趣的基因的kegg注释图就完成绘制了!Pathview支持上百种有参物种,适用性很广,感兴趣的话赶紧试一下吧!
信息来源:https://www.jianshu.com/p/f90ed1c52079、组学大讲堂等
本文所有内容及图片未做商业用途,如有版权问题可联系下方小助理,及时处理~