技术贴 | Omicshare在线平台搞定GO功能注释和GO功能富集
本文由沐子星根据实践经验而整理,希望对大家有帮助。
原创微文,欢迎转发转载。
GO(Gene Ontology)是基因本体联合会(Gene Ontology Consortium)所建立的数据库,对基因和蛋白功能进行限定和描述,适用于各物种。GO数据库包含三大类:生物学过程(Biological Process, BP)、细胞成分(Cellular Component, CC)和分子功能(Molecular Function, MF),各自描述了基因产物可能参与的生物学过程,所处的细胞环境,以及行使的分子功能。GO注释是对某个特定基因功能的描述;GO富集是将具有类似功能的基因富集到同一term中,对基因的功能更具有指向性。
Omicshare在线平台搞定GO功能注释和GO功能富集
一、GO功能注释
(1)登录omicshare在线平台
omicshare平台网址:https://www.omicshare.com/tools/,选择GO功能注释板块。
(2)准备待注释的基因文件。
基因文件可以是碱基序列,也可以是氨基酸序列,Fasta格式。
(3)提交序列。
在平台上提交待注释的序列,根据序列类型相应选择核酸或者蛋白。
选择相应的物种:动物、植物、无脊椎动物、微生物、病毒等。
(4)设置完成后,点击提交。
结果运行后,刷新任务状态,查看注释结果,并下载。
本次的注释结果可用于下一步的GO富集分析。
二、 GO功能富集
同样在omicshare平台(https://www.omicshare.com/tools/)上,选择动态GO富集分析。该分析有两种途径:第一,使用平台中内置的背景基因文件进行富集;第二,使用自己准备的背景基因文件进行富集。一般来说,如果研究的物种不是模式物种或与模式物种相差较远时,推荐使用自己准备的背景基因文件。当然,这两种途径我们都会介绍。
1使用平台上内置的背景基因文件
平台内置的背景基因文件来自常用的数据库,包括模式物种的注释信息,如人、小鼠、果蝇、线虫等。使用平台上内置的背景基因文件做GO富集分析时,只需要准备目的基因列表。
(1)准备目的基因列表。
目的基因列表中只包含基因名称(也可以附加差异表达倍数),基因名称必须符合背景文件中的基因名称。例如,Ensemble数据库中的基因名称及对应的GO注释文件是这种类型:
(2)目的基因名称转换。
如果目的基因列表中的基因名称不符合数据库中的基因名称形式,可以应用Ensembl主页下的BioMart工具进行转换。
(3)上传目的基因,选用“使用已有参考”。
(4)设置完成后,提交。等待查看结果,可以展示二级分类柱状图,还可以展示泡泡图。最后保存结果文件(下图为目的基因列表中不包含差异倍数的情况)。
2. 使用自己准备的背景基因文件
(1)准备背景文件,只包含基因列表和GO注释。一般通过Excel格式另存为制表符格式,txt文件。注意不要有空格、中文、特殊符号等。
(2)准备自己的目的基因。目的基因文件中可以包含差异倍数(log2FoldChange),也可以不包含。
(3)上传文件。注意:如果目的基因列表中有差异倍数(log2FoldChange),类型要选择diff,如果目的基因列表中没有差异倍数(log2FoldChange),类型要选择nodiff。本次以有差异倍数的富集为例。设置完成后,点击提交。
(4)查看结果。结果中展示出表达上调和下调的情况,有分组效果。柱状图的颜色可以自定义调整。
(5)保存结果。导出基因列表,图片一般导出svg矢量图,以便于后期修图软件操作。
最后,祝大家科研顺利!
感谢阅读!