答读者问第一弹:R里面差异分析的limma包用法细节

又一次收到一个同样的求助,我不得不写推文来公开介绍这个知识点,希望大家转发给所有的初学者,别再犯糊涂了!

问题描述如下:

曾老师,这是limma包的第42页,我也在附件里面给您发了这个,我想问下,这个Group前面有时候加0,有时候不加,是个什么讲究呢。另外这里有2种方法建立这个approach,怎么选择合适呢。非常感谢您。

其实很久以前我就专门在我的github里面提到到这个知识点,这些年陆陆续续回答了不下十次这个细节的讲解了。

差异分析是否需要比较矩阵

最流行的差异分析软件就是limma了,它现在更新了一个voom的算法,所以既可以对芯片数据,也可以对转录组高通量测序数据进行分析,其它所有的差异分析软件其实都是模仿这个的。

我以前讲到过做差异分析,需要三个数据:

  • 表达矩阵

  • 分组矩阵

  • 差异比较矩阵

前面两个肯定是必须的,有表达矩阵,样本必须进行分组,才能分析,但是我看到过好几种例子,有的有差异比较矩阵,有的没有。

后来我仔细研究了一下limma包的说明书,发现这其实是一个很简单的问题。

大家仔细观察下面的两个代码

首先是不需要差异比较矩阵的

   library(CLL)    data(sCLLex)    library(limma)    design=model.matrix(~factor(sCLLex$Disease))    fit=lmFit(sCLLex,design)    fit=eBayes(fit)    options(digits = 4)    #topTable(fit,coef=2,adjust='BH')    > topTable(fit,coef=2,adjust='BH')               logFC AveExpr      t   P.Value adj.P.Val     B    39400_at  1.0285   5.621  5.836 8.341e-06   0.03344 3.234    36131_at -0.9888   9.954 -5.772 9.668e-06   0.03344 3.117    33791_at -1.8302   6.951 -5.736 1.049e-05   0.03344 3.052    1303_at   1.3836   4.463  5.732 1.060e-05   0.03344 3.044    36122_at -0.7801   7.260 -5.141 4.206e-05   0.10619 1.935    36939_at -2.5472   6.915 -5.038 5.362e-05   0.11283 1.737    41398_at  0.5187   7.602  4.879 7.824e-05   0.11520 1.428    32599_at  0.8544   5.746  4.859 8.207e-05   0.11520 1.389    36129_at  0.9161   8.209  4.859 8.212e-05   0.11520 1.389    37636_at -1.6868   5.697 -4.804 9.355e-05   0.11811 1.282

然后是需要差异比较矩阵的

   library(CLL)    data(sCLLex)    library(limma)    design=model.matrix(~0+factor(sCLLex$Disease))    colnames(design)=c('progres','stable')    fit=lmFit(sCLLex,design)    cont.matrix=makeContrasts('progres-stable',levels = design)    fit2=contrasts.fit(fit,cont.matrix)    fit2=eBayes(fit2)    options(digits = 4)    topTable(fit2,adjust='BH')               logFC AveExpr      t   P.Value adj.P.Val     B    39400_at -1.0285   5.621 -5.836 8.341e-06   0.03344 3.234    36131_at  0.9888   9.954  5.772 9.668e-06   0.03344 3.117    33791_at  1.8302   6.951  5.736 1.049e-05   0.03344 3.052    1303_at  -1.3836   4.463 -5.732 1.060e-05   0.03344 3.044    36122_at  0.7801   7.260  5.141 4.206e-05   0.10619 1.935    36939_at  2.5472   6.915  5.038 5.362e-05   0.11283 1.737    41398_at -0.5187   7.602 -4.879 7.824e-05   0.11520 1.428    32599_at -0.8544   5.746 -4.859 8.207e-05   0.11520 1.389    36129_at -0.9161   8.209 -4.859 8.212e-05   0.11520 1.389    37636_at  1.6868   5.697  4.804 9.355e-05   0.11811 1.282

大家运行一下这些代码就知道,两者结果是一模一样的。

而差异比较矩阵的需要与否,主要看分组矩阵如何制作的!

design=model.matrix(~factor(sCLLex$Disease))

design=model.matrix(~0+factor(sCLLex$Disease))

有本质的区别!!!

前面那种方法已经把需要比较的组做出到了一列,需要比较多次,就有多少列,第一列是截距不需要考虑,第二列开始往后用coef这个参数可以把差异分析结果一个个提取出来。

而后面那种方法,仅仅是分组而已,组之间需要如何比较,需要自己再制作差异比较矩阵,通过makeContrasts函数来控制如何比较!

关键问题在于大家只是想学一个limma包的用法,并没有去探究里面的本质,每个参数的设置都是有意义的,而且里面的统计学知识非常丰富。

如果你也想问我问题,请看点击这个提问须知

苹果用户如果要赞赏,请点击欢迎商务洽谈

(0)

相关推荐

  • 差异分析|DESeq2完成配对样本的差异分析

    本文为群中小伙伴进行的一次差异分析探索的记录. 前段时间拿到一个RNA-seq测序数据(病人的癌和癌旁样本,共5对)及公司做的差异分析结果(1200+差异基因),公司告知用的是配对样本的DESeq分析 ...

  • 自然语言处理之LDA主题模型

    话题模型 话题模型 是为发现文档集合中的 话题 而开发出来的一种统计方法.常见的话题模型有LSA.PLSA.LDA,其中LDA(Latent Dirichlet Allocation)是表现最好的话题 ...

  • “虻链农业靠什么赚钱?”苍蝇姑娘靳任任就黑水虻养殖答读者问

    自从中央电视台以<十年辛苦就为一只大苍蝇><黑水虻人虫中赢利>.<芦丁鸡小产蛋多,连粪便都值钱>.<黑水虻和芦丁鸡搭伴巧挣钱>等为题报道了我开发黑水虻养 ...

  • 答读者问:什么是计划性?我从现在开始努力晚吗?

    明珠絮语-教育|美文|人生感悟 联系:mingzhu786(转载)hbliuchanghai(商务) mingzhudz(读者) 原创首发|明珠絮语(ID:tsliuchanghai),转载请联系授权 ...

  • 答读者问:如何把庞大的知识,有效吸收和内化?

    主播:吴名 这本书是由布隆伯格大学教授卡尔·卡普.学习和绩效领域资深顾问罗宾·德费利斯所写.在6月4日的晨读中,一位读者提出了一些疑问.简单讲是2点,第1点是如何理解更短的时间等于更专注:第2点是我们 ...

  • 答读者问 | 中老年耳鸣是怎么回事?中医如何调理胃食管反流?

    下面摘取了一部分最近的提问,给有同样疑惑的大家参考. 提问 Qustions & 解答 Answers Q1:43岁,女,排便规律,一天一次或两到三次,大便偶尔不成形,大便粘马桶的情况不太常见 ...

  • 职场案例兼答读者问 丨 穷男人,干一行爱一行!

    该文发布时间是19:08,因为今天是这个月的8号. 答读者问,在文章最后.正文部分,是对爱情和事业的思考. 男人谈恋爱的优势是什么?男人的外表,衣着,气质,智慧,心胸,对这个世界的解决方法. 男人要每 ...

  • 《此物最相思》之答读者问

    2017年10月1日,我开始创作长篇历史爱情小说<此物最相思>,执迷不悟地写那些人和那个时代.2021年6月26日,全书完稿,共计96万余字. <此物最相思>以王维为第一男主人 ...

  • 答读者问:如何为人、治学?

    答读者问:如何为人.治学? 今天,发送一则答读者来信,希望能够帮到更多的人.当然,我的回答也仅是就我所知,尚有很多不足.望知悉.非常感谢这位朋友提出的问题. 从2016年底开通微信公众号以来,从每天一 ...

  • 答读者问:该不该选文科?

    " 追随心的选择!"--周小泉 今天,查看公众号助手.翻到两位读者留言,一位是问<高中历史讲义纲要>的版本,一位是录进一中高分段的学生关于文科的提问.问题如下: 本来我 ...

  • 四圣心源:答读者问二则

    这几日,我收到了许多网友的提问,有二则提问颇有意义,所以我专门写了一篇文章来回答. 网友提问1:我目前的鼻炎,主要症状就是鼻塞,喷嚏和清鼻涕都很少,遇到热的东西或者身体热起来鼻子就通.可以试试(桔梗) ...