cytoscape的十大插件之六-GENEMANIA
五一劳动节,连续五天,在钉钉群直播互动授课带领大家系统性掌握cytoscape软件的使用方法和技巧,课程已经结束啦。文末有录播回放学习方式,以及配套授课资料!
一、初识
GeneMANIA (http://genemania.org/)是个可生成关于基因功能的假设,分析基因列表和根据功能分析基因优先级的数据库。给出一个查询基因列表,其根据丰富的基因组学和蛋白质组学发现功能相似的基因,并根据预测值对其加权。
另一个用途是基因功能预测。只要有一个查询基因,GeneMANIA可根据相互作用,找到共同功能基因。
支持物种:Arabidopsis thaliana, Caenorhabditis elegans, Danio rerio, Drosophila melanogaster, Escherichia coli, Homo sapiens, Mus musculus, Rattus norvegicus and Saccharomyces cerevisiae
文献
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC8034893/
文献直接用 GeneMANIA 做PPI网络,非常美观,一般无需任何加工
二、分析
2.1 物种选择
页面左上角就可看到【物种选择】,图标很直观,so cure。默认就直接是个小人,代表人类。
2.2 数据集
点击右侧,可选择分析的网络数据集,系统会自带默认的数据集,一般包括包括蛋白质-蛋白质、蛋白质-DNA和遗传相互作用、途径、反应、基因和蛋白质表达数据、蛋白质结构域和表型筛选情况
这数据集命名也有一定规律:与数据源相关联的PubMed条目生成的(第一作者-最后作者-发表年份),或者只是数据源的名称 这是关于可选数据集的说明,大家有兴趣可探讨下哈 共同表达:基因表达数据。在基因表达研究中,如果两个基因的表达水平在条件上相似,则两个基因是相互关联的。这些数据大部分来自基因表达综合(GEO):与出版物相关的数据。 物理交互:蛋白质-蛋白质相互作用数据。如果发现两基因对应蛋白有连接,它们基因就会相互关联。这些数据是从蛋白质相互作用数据库(包括BioGRID 和PathwayCommons)中发现的 遗传相互作用:遗传相互作用数据。如果发现一个基因表达变化能对第二个基因产生影响,则两个基因在功能上是相关的。这些数据是从之前的研究结果和BioGRID中收集的。 共享蛋白质域:蛋白质域数据。如果两种基因具有相同的蛋白质领域,它们就会相互关联。这些数据是从数据库(如InterPro, SMART and Pfam)收集的。 联合本地化:如果两个基因都在同一组织中表达,或者他们的基因产物都在同一细胞位置被识别,则两个基因是相连的。 富集通路:路径数据。如果两个基因在通路内参与相同的反应,它们就会相互关联。这些数据通过路径通信从各种数据库(如Reactome and BioCyc, via PathwayCommons.)收集。 预测:预测基因之间的功能关系,通常是蛋白质相互作用。预测数据的一个主要来源是通过绘制来自另一个生物体的已知功能关系图。例如,如果已知两种蛋白质在另一个生物体中相互作用,则预测两种蛋白质会相互作用。例如,从人类网络预测的鼠网络:Barrios-Rodiles-Wrana-2005-Human2Mouse。 其他:不属于上述任何类别的网络。如:correlations from Ensembl, disease information from OMIM and chemical genomics data. 已上传:已上传的网络。
http://pages.genemania.org/help/#Network_data_sources
何为权重??? 权重是指某一因素或指标相对于某一事物的重要程度,其不同于一般的比重,体现的不仅仅是某一因素或指标所占的百分比,强调的是因素或指标的相对重要程度,倾向于贡献度或重要性。 高级选项 这些加权方法基于与GO相关的3到300个基因 Biological Process based:假设输入基因列表与GO生物过程相关。输入基因列表包含少于 5 个基因,则这是默认方法。 Molecular Function based:假设输入基因列表与GO分子功能相关 Cellular Component based:假设输入基因列表与 GO 细胞成分相关 自动选择的权重方法(默认值)(Automatically selected weighting method (default)):网络权重是根据输入基因列表的大小选择的。如果您的输入基因列表中只有不到 5 个基因,则默认的网络加权方法为"基于基因-本体 (GO)”的加权。此加权方法假定输入基因列表与生物过程相关(由 GO 定义)。如果您的输入基因列表有 5 个或更多基因,GeneMANIA 将采用assigned based on query gene方法 Max resultant genes:最大合成基因数 Max resultant attributes:最大合成属性 依赖查询的权重(Query-dependent weighting) **基于查询基因分配(assigned based on query gene):**使用线性回归自动选择,使基因尽可能多地相互交互,并尽可能少地与不在列表中的基因进行交互。如果您的输入基因列表包含超过 5 个基因,则这是默认方法。 基于GO分析的权重(Gene Ontology (GO)-based weighting) 相等权重(Equal weighting) **Equal by network:**所有网络的权重均相等。(忽略通路上基因的分布,有些具有共线性) **Equal by data type:**所有网络类别的权重均相等,权重也均匀分布在每个类别中的网络之间 一般系统默认权重方法:自动选择的权重方法(默认值)(Automatically selected weighting method (default))
2.3 分析
这是示例基因,后点击 search 即可分析。(格式规定需要一行一基因,需要我们提前整理好文本)
先看下整体页面
2.4 样式调整
2.5 网络信息
网络总包含32个基因,示例有12个,得出相关连的20个,549条连接
2.6 保存
可直接保存成图片,还可把保存各种数据如网络,基因,功能等
2.7 GO富集分析
左下角还有富集分析数据,根据FDR排序 点击多个功能,有不同颜色对应该功能的基因,并在网络图显示
2.8 历史记录
下方保存历史记录,可来回切换,非常方便
2. 9 涉及数据集
网络右方,有涉及的数据集及比例,edges也用了不同颜色的线区分
三、总结
GENEMANIA 与string数据库差不多,但其网页版出图非常方便。cytoscape也可以下载其app进行分析,网络图调整,但里面要下载非常大的数据集,如果断网还得重新下载,推荐大家直接使用网页版! 使用GENEMANIA 的文献: https://ovarianresearch.biomedcentral.com/articles/10.1186/s13048-019-0578-1 https://www.hindawi.com/journals/bmri/2014/278748/ https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7177039/
大家可以 自行下载钉钉软件申请进群看录播以及下载课程配套资料,“cytoscape网络图绘制”群的钉钉群号:34970303
文末友情推荐
赞 (0)