做GSEA分析你的基因到底该如何排序

2024-06-15 06:13:32

大家都知道，GSEA最重要的就是数据集的所有背景基因按照某种指标排序好，这样才能说明你感兴趣的基因集是否在背景基因集里面出现了统计学显著的富集情况，如下：

很明显，我们感兴趣的这个基因集，也就是 humoral immune response 有34个基因，而且是显著性的分布在我们的4000多个背景基因的头部，经过统计学公式计算得到了它的一些指标，说明了其显著性。

但是这里面隐藏着一个很有趣的细节，就是背景基因到底是应该如何排序呢？而java版的GSEA软件提供6种排序方法，包括：

signal-to-noise ratio (S2N)
ratio of average expression from two classes (Ratio)
T-test statistic (T-test)
the Pearson correlation coefficient for quantitative studies

毕竟，有一个哲人曾经说过：所有的统计学模型都是错的，但总有一些是好用的，所以探究哪一个更好用是我们永恒不变的追求。

12种排序方法

在文章：2017 https://doi.org/10.1186/s12859-017-1674-0 里，作者分析了 28个数据集，使用了 16 种排序方法，做了非常详细的统计学指标比较分析。最后的结论是：

The absolute value of Moderated Welch Test has the best overall sensitivity and Minimum Significant Difference has the best overall specificity of gene set analysis.

感兴趣的朋友可以努力翻译弄懂这篇文章，非常值得初学者耗费心力仔细研读，如果你愿意深究它，请务必邮件联系我，让我知道，我希望认识一些优秀的小伙伴。

（PS：我昨天才发出这个需求，马上唐医生就完成了，这这执行力，佩服！）

如果是DESeq2的差异分析结果

有人推荐如下指标进行排序：

x$fcsign <- sign(x$log2.fold_change) x$logP=-log10(x$p_value) x$metric= x$logP/x$fcsign

当然这是一个参考而已。

赞 (0)

点点点 | 真香！Simple GO GSEA 富集分析 ~

写在前面时间拨回去 2015年,那时我接触生信已有一年,TBtools 开发尚在萌芽阶段.那会,我写了几款小的软件,包括 "blast3go",为的是应对即将收费的"b ...
生信分析中GSEA分析(GO/KEGG富集分析)的重要性

各位医学方的朋友,大家好.我是Flyman! 做过下游分析的小伙伴都知道富集分析的重要性,生信类文章大家总会在最后一步针对我们前面筛选出来的差异基因做一下GO/KEGG富集分析,研究一下他们参与到什么 ...
手把手教你用R做GSEA分析

GSEA是非常常见的富集分析方式,以前我们做GSEA需要用依赖java的GSEA软件,那个时候准备分析的文件可能要花上很长时间,报错还不知道如何处理.现在我们来学习一下R语言进行GSEA分析. 加载R ...
说法分析——所谓的秃头基因到底是否存在？

现在开始,美国的家庭在节日到来只是,不再选择购买袜子.优惠券或俗气的毛衣,而是开始给彼此一个更令人兴奋的节日礼物--DNA检测试剂工具包.该工具包除了评估你的家族遗传历史外,还测试了不同基因的存在,从 ...
TCGA的28篇教程- 对TCGA数据库的任意癌症中任意基因做生存分析

长期更新列表: 使用R语言的cgdsr包获取TCGA数据(cBioPortal)TCGA的28篇教程- 使用R语言的RTCGA包获取TCGA数据 (离线打包版本)TCGA的28篇教程- 使用R语言的R ...
单基因GSEA分析策略（数据分析免费做活动继续）

我写了部分常见的TCGA数据库用法: TCGA的28篇教程-免疫全景图 TCGA的28篇教程-指定癌症查看感兴趣基因的表达量 TCGA的28篇教程-对TCGA数据库的任意癌症中任意基因做生存分析 TC ...
如何获取非模式生物KEGG PATHWAY的基因集并用clusterProfile做GSEA？

学徒和学员已经陆续出师,是时候把生信技能树的舞台交给后辈了! 下面是四川成都大熊猫基地学员原创教程作者 so_zy, 2020-10-14 写此文档的缘由:在做GSEA分析时,由于研究的是非模式生物 ...
做meta分析到底至少要纳入多少篇文献？

做meta分析到底至少要纳入多少篇文献?这是很多刚开始学习meta分析的时候问到的问题.那到底有没有一个具体的数值呢? 之前在网上看到有大牛说,至少10篇才有意义:也有大牛说至少要5篇:也有些说至少要 ...
做了安心还是不做没意义，BRCA基因检测到底做不做？

提起BRCA基因检测,觅友们便七嘴八舌地讨论开来,但大体却分为了两大派别.一边是做了安心派,另一边是不做没意义派.我们且来听听觅友们对于BRCA基因检测的不同看法. 做了安心派: "我们家姑 ...
大舍得：寒门做题家的身上，到底存在什么致命缺陷？

无教养,无以立人. Manners-maketh-man. 正文: 对于关注灏泽的为人父母者,我想说句真心话,那就是从我手里审阅过运势命格孩子数不胜数,其实很多孩子需要的仅仅是适度是引导,就能成长得很 ...
净心、净目、净耳、净手，做个安静的书法人到底有多难？

不妨先从电影<百鸟朝凤>说起吧,故事是这样的: 在无双镇,吹唢呐这种传之久远的民间艺术,在办丧事时是对远行故去者的一种人生评价:道德平庸者只吹2台,中等者吹4台,上等者吹8台,德高望重的逝 ...