cytoscape插件之Cluego&Cluepedia

五一劳动节,连续五天,在钉钉群直播互动授课带领大家系统性掌握cytoscape软件的使用方法和技巧,课程已经结束啦。文末有录播回放学习方式,以及配套授课资料!

下面是cytoscape讲师的笔记

一、初识

  • Cluego是cytoscape一款富集分析及可视化的插件,支持200多个物种,数据库及时更新,多个注释数据集,富集结果以网络形式呈现。其中,插件一共有三个功能,富集分析,富集结果可视化和基因/miRNA富集网络
  • 富集结果一般呈现这样效果,非常美观,还能体现通路聚类的信息。
  • 下面分别展示下插件的三个功能~

二、申请license

  • Cluego第一次使用需要按照提示申请 license
  • http://www.ici.upmc.fr/cluego/cluegoLicense.shtml
  • 填写基本信息,一般需要几天时间,以邮件的形式回复
  • 后面会返回一个key,用它登陆插件即可

三、富集分析

3.1 参数调整

  • Analysis Mode:插件一共有三个功能,若需要富集分析,选第一个

  • Visual Style:

    • Goup:节点越大,通路p值越小(一般选这个)

    • Significance:节点越大,通路富集基因越多;颜色越深,p值越小

  • Ontologies/Pathways : 数据库选择(没有默认GO富集,需要挑选)

  • Evidence:GO富集证据树,有经实验证明,没有实验证明等等,层层分级。一般选择ALL,选择其他项可导致某些证据的缺失

  • 下面两个一般不用调整,物种的信息可在上面一开始的时候选择(若分析结果不好,可尝试更新数据库,看是否是信息的缺失)
    • Network Specificity 和 GO Tree Interval
      • 若有相似功能的基因,会整体合成一个通路
      • 一般选择这一项,不然后面出来的网络图过大
      • 这两项是同时变化的,表示GO 富集的level(分类)

      • 总体分成三个功能:细胞组分(cellular component, CC)、分子功能(molecular function, MF)、生物过程(biological process, BP)。往细节分可看到不同功能之间的关系

      • 一般选择默认的3-8 level,若得出网络图过大,可调节level 之间变小

      • Use GO Term Fusion:

      • Show only Pathway with PV

      • 一般小于0.05 的有显著统计学意义功能会被富集出来

    - 最小基因数:该通路所富集到的最小基因数
    - 富集因子:该通路富集到的基因/该通路本来的基因数

    • Kappa分数:定义边的参数,确定两节点之间是否相连

      • (若网络过大,可通过调高上面参数试试)
      • 选择布局后,点击START 开始分析

    3.2 结果

    • 开始后,会出现下面的方框
    • 可看到用了GO数据库,以及形成30个节点,29条边的网络
    • 形成的网络
    • 下方呈现富集表格
    • A:隐藏小的通路

    • B:改变颜色

    • C:刷新

    • D:导出个文件夹(富集条形图,饼图,表格等)

    • E:单独导出富集表格

    • 同样也可以点击 CluePedia图标进行网络的调整

    • 最终导出结果:富集表格(通路,P值,基因......)
    https://cdn.jsdelivr.net/gh/xiayh17/Figs@main/uPic/Untitled_23_1626955309.png

    四、富集结果可视化

    • 这里展示第二个功能:富集结果可视化。一般情况下在DAVID,Metascape或其他富集网站得到结果后,希望以网络的形式展现,就使用到这个功能
    • 选择 Preselected Functions
    • 选择物种后,输入格式为:GO通路,P值两列(无需包含列名)
    • 下面Ontologies/Pathways 富集的数据库需要对应上面通路。(如果输入的是GO富集结果,这里选择了kegg,结果会显示不出来)
    • 这里例子输入六个通路,最后网络显示出六个节点,2条边

    五、基因/miRNA富集网络图

    • 输入对应对应的miRNA,后点击 Start
    • 添加预测数据库
    • 一般选择第23个数据库信息下载,之后按步骤进行富集(需要选中所有miRNA)
    • 点击 Enrich出现下面调节框,默认Threshold selections是10,如果需要预测更多靶基因,可相应调高
    • 这样已构建好miRNA-mRNA网络,下面做富集分析:
    • 预测出来后,重新选择第一个功能进行富集分析
    • 注意选择,这样网络上没富集到通路的基因也会呈现出来
    • 结果:
    • 选择这个图标也可将基因全显示出来
    • 可观察到miRNA消失了,只剩下富集的网络。这时候需要更新下之前我们已经做过了的miRNA网络
    • 这样最后就可以显示miRNA-靶基因-富集通路 三层网络了

    六、总结

    • 不过,大家其实很少用到最后三层网络的功能。因为插件内在的靶基因预测数据库不知道来源及更新程度,做出的结果可能受到质疑,这情况下一般都是用常用的预测网页miRWalk,miRTarBase等来进行预测。

    • 关于插件的文献:
    • https://www.ncbi.nlm.nih.gov/pmc/articles/PMC8047669/
    • https://faseb.onlinelibrary.wiley.com/doi/abs/10.1096/fasebj.2020.34.s1.09169
    • https://www.sciencedirect.com/science/article/pii/S2352340921000640
    • 参考资料:
    • https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2666812/
    • http://www.ici.upmc.fr/cluego/ClueGODocumentation2019.pdf
    • https://academic.oup.com/bioinformatics/article/35/19/3864/5371065

    大家可以 自行下载钉钉软件申请进群看录播以及下载课程配套资料,“cytoscape网络图绘制”群的钉钉群号:34970303

    文末友情推荐

    (0)

    相关推荐