惊!画出来的火山图居然缺半边?

最近刷文献,发现一个很有趣的火山图,文献是发表在 October 7, 2019的PNAS的:Immune effector monocyte–neutrophil cooperation induced by the primary tumor prevents metastatic progression of breast cancer

是可以展现指定基因集的火山图

这篇文章的测序数据是公布的:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE137300 表达矩阵及差异分析结果,都可以直接下载。

可以看到测序策略是:

GSM4074939    mRNA_Neutrophils_TN1 [tag_191]
GSM4074940    mRNA_Neutrophils_TN1 [tag_482]
GSM4074941    mRNA_Neutrophils_TN2 [tag_367]
GSM4074942    mRNA_Neutrophils_TN2 [tag_706]
GSM4074943    mRNA_Neutrophils_TN2 [tag_1341]
GSM4074944    mRNA_Monocytes_CCR2+_TN1 [tag_191]
GSM4074945    mRNA_Monocytes_CCR2+_TN1 [tag_482]
GSM4074946    mRNA_Monocytes_CCR2+_TN2 [tag_367]
GSM4074947    mRNA_Monocytes_CCR2+_TN2 [tag_706_]
GSM4074948    mRNA_Monocytes_CCR2+_TN2 [tag_1341]

其中:

  • the highly metastatic tumors HCl-001 (TN1)

  • low metastatic tumors HCl-002 (TN2).

也就是说两种tumor,然后两种细胞,这样的4个分组,但是里面的火山图(不要问我是如何看出来这是一个火山图的)如下:

image-20191205084736675

可以看到,是缺半边的,如果你仔细看文章,其实是因为作者使用这样的图是为了选择性的展示数据来说明他自己的生物学故事,他们这个图展现的仅仅是 immune effector genes (GO:0002252) 的基因。

并不是全部的基因。

通常我们的火山图左右两边的点数量差不多,就是说上下调基因数量。

看起来比较正常的火山图是

随便搜索一下很多关于火山图的介绍,我这里就不赘述了。

volcano

也有一些时候全部基因的火山图也不正常

如下,我在安排学徒完成11个GSE数据集的时候,发现其中一个(GSE21785)的火山图看起来略微有点诡异!

volcano

检查代码的时候发现,其表达量分布具有分组差异。

image-20191205104926769

但是如果你从作者上传的芯片原始数据(GSE21785)开始,就会发现,是下面的分布:

image-20191205104718657

原始数据的处理,大家参考:你要挖的公共数据集作者上传了错误的表达矩阵肿么办(如何让高手心甘情愿的帮你呢?) 里面的代码:

# BiocManager::install(c( 'oligo' ),ask = F,update = F)
library(oligo) 
# BiocManager::install(c( 'pd.hg.u133.plus.2' ),ask = F,update = F)
library(pd.hg.u133.plus.2)

dir='~/Downloads/GSE84571_RAW/'
  od=getwd()
  setwd(dir)
  celFiles <- list.celfiles(listGzipped = T)
  celFiles
  affyRaw <- read.celfiles( celFiles )
  setwd(od)
  eset <- rma(affyRaw)
  eset
  # http://math.usu.edu/jrstevens/stat5570/1.4.Preprocess_4up.pdf
  save(eset,celFiles,file = f)
  # write.exprs(eset,file="data.txt")

得到的eset这个对象,与我们之前一直讲解的GEOquery包下载是一样的, 所以后续代码不需要变化。

这些数据集你也尝试一下吧

我觉得蛮有意义的。

GSE1462
GSE18732
GSE20950
GSE21785
GSE26526
GSE32575
GSE43837
GSE474
GSE58979
GSE60291
GSE62832
GSE70529
GSE72158

可以使用我们的4大R包啦

很方便的下载数据

rm(list = ls())
options(stringsAsFactors = F)
library(GEOmirror)
geoChina('GSE21785')
load('GSE21785_eSet.Rdata')
exp <- exprs(gset[[1]]) 
exp[1:4,1:4]
pd <- pData(gset[[1]])
anno = gset[[1]]@annotation
group_list =c(rep("Tubulus",6),rep("Glomerulus",6))
group_list=factor(group_list,levels = c("Tubulus","Glomerulus"))
boxplot(exp,las=2,col=group_list)

差异分析,火山图,热图,基因注释看以前的教程吧,这周的四个R包基本上能进解决你88%的问题!

欢迎大家提交试用体验,也可以加入交流群:4年前的TCGA重磅资料你学了吗

(0)

相关推荐

  • R语言GEO数据挖掘01-数据下载及提取表达矩阵

    欢迎来到医科研,这里是白介素2的读书笔记,跟我一起聊临床与科研的故事, 生物医学数据挖掘,R语言,TCGA.GEO数据挖掘. 这一节的内容包括应用 GEOquery包下载芯片数据,提取表达矩阵,提取m ...

  • 不就画个火山图吗?有那么难吗?

    写在前面 Emmm....课题组昨天开小组会了. 基于博导的建议与提醒,我又开始跳下来看生物学问题. 在当前课题的实验设计里面,我们总共有70个样品,于是我写了一个循环 做了每个样品之间两两差异表达分 ...

  • 画个火山图而已?当然不是。

    写在前面 前两天我推了一个博文<不就画个火山图吗?有那么难吗?>.放出了一个传说中的火山图绘制功能.怎么说呢?难道,所有人都以为我就只是想画个图,交差了事?当然不是!经费是导师的,课题是自 ...

  • 严家宽 || 宋画《荔枝绶带图》惊现于私人藏家

    2020年1月,一幅<荔枝绶带图>由美籍华人对外展示,沉寂多年的宋代宫廷花鸟画有了惊人的新发现.<荔枝绶带图>尺寸为56cm×120cm(作者:佚名),材料为绢,年代为宋,这幅 ...

  • 五行代码画出漂亮的火山图

    数据准备 我们需要准备一个输入文件,命名为input.txt,如下图: 五行代码 第一行代码: setwd("C:\\Desktop") #设定工作目录 第二行代码: librar ...

  • 斗室南窗竹几竿:启功画竹三十图

    启功(1912--2005),自称"姓启名功",字元白,也作元伯,号苑北居士,北京市满人.中国当代著名书画家.教育家.古典文献学家.鉴定家.红学家.诗人,国学大师. 竹石图 雨挟狂 ...

  • 他画的百鸟图,可谓一纸风行!

    111 钱行健(1935-2010),海上画坛颇负盛名的花鸟画家,被誉为海上书坛优美的风景线. 钱行健上世纪80年代画的<百鸟图>,是他享誉画坛的作品,成为当时大专院校美术专业学生研习花鸟 ...

  • 齐白石画的《草蛇图》,少白汤发周说草虽然寥寥几 笔,却最不易画

    世上曾有齐白石,余墨犹存人世间. 要问余墨哪里赏,上海松江大学城! 虽然我们都知道白石老人在艺术表现上丰富多样,但见到这 幅<草蛇图>,仍然感觉 他的创作真是太广泛了. 可能他见过的东西只 ...

  • 吴昌硕画的那些梅花图

    吴昌硕<红梅图> 吴昌硕一生酷爱梅花,自号"苦铁道人梅知己". 吴昌硕画梅注重气势,捭阖纵放,疏密有致,焦墨枯笔,顺逆来去,横枝纵丫,曲直苍劲,时而欲探水揽月,时而欲凌 ...

  • 历代画家爱画的“岁朝图”

    画角声中旧岁除,新年喜气满屠苏. 阳和忽转冰霜后,元气更如天地初. 晚色催诗归草梦,春光随笔上桃符. 闭门贺客相过少,静对梅花自看书. <岁朝>一诗出自宋朝诗人真山明,较为形象地描写了古人 ...