学徒作业-在CCLE数据库里面根据指定基因在指定细胞系里面提取表达矩阵

看到发表在 Cell. 2020 Mar 4. 的文章的研究项目里面有 4个10X样本,题目是:Complement Signals Determine Opposite Effects of B Cells in Chemotherapy-Induced Immunity. (PMID:32142650,DOI:10.1016/j.cell.2020.02.015) ,我没有细看文章的生物学故事,不过注意到附件有一个图表很有趣:

指定基因在指定细胞系的表达量热图

适合作为学徒作业,你需要去搜索了解一下CCLE数据库,下载它的RNA-seq表达矩阵,然后根据图里面的基因名字和细胞系名字,取出需要的表达矩阵,然后热图可视化即可。

详细的图例是:The relative expression of complement regulatory proteins (CD55, CD46, CRIg, CR1, Factor H, Factor I, FHL1, C4BP, Properdin and C1INH) in BT474, BT549, MDA-MB-231, HCC1937, MDA-MB-361, MDA-MB-436, MDA-MB-468, AU565, SK-BR-3, MCF-7 and MDA-MB-453 cells were evaluated by using mRNA data from the Barretina Cell Line database.

CCEL数据库介绍

需要简单注册后才能下载:https://portals.broadinstitute.org/ccle/users/sign_in

下载到需要的数据文件后可以先看看CCLE里面收集的细胞系表型信息,大家可以自由统计。

options(stringsAsFactors = F)
a=read.table('data/CCLE_sample_info_file_2012-10-18.txt',sep = '\t',header = T)
as.data.frame(sort(table(a$Source),decreasing = T))
##                       Var1 Freq
## 1                     ATCC  437
## 2                     DSMZ  221
## 3                    HSRRB  121
## 4                     KCLB   66
## 5                    RIKEN   66
## 6                    ECACC   62
## 7  Academic Lab / Achilles   42
## 8             Academic Lab   12
## 9                     ICLC    7
## 10                NCI/DCTD    7
## 11                            5

其它细胞系药物作用数据库

提到细胞系药物作用数据库,最出名的是 Cancer Cell Line Encyclopedia (CCLE) 和    Cancer Genome Project (CGP) / Genomics of Drug Sensitivity in Cancer (GDSC) 这两个:
  • CCLE (www.broadinstitute.org/ccle/)
  • GDSC/CGP (www.cancerrxgene.org/)
其实还有broad的 CTRP和Roche的geneTech公司的数据库也类似。
其中 GDSC 也就是 CGP,包含着4种数据。
(0)

相关推荐

  • 肿瘤细胞系多组学数据库

    对于肿瘤细胞系的分析,之前我们介绍过 .但是随着CCLE系统的升级.之前介绍的一些功能基本上也用不了.按照之前的帖子,我们在进入CCLE网址之后,界面变成了下面的这个样子.所以为了更好的时候使用CCL ...

  • 多数据库玩出新花样,3+分新套路!

    Identification of Prognostic Dosage-Sensitive Genes in Colorectal Cancer Based on Multi-Omics 基于多组学的 ...

  • 基因表达可视化工具

    目前,cBioPorta.GEPIA等现有生物学工具为基因表达分析提供了许多有用的可视化和分析工具,但是并不能充分解决实验生物学家要求的其他一些快速分析.例如,根据初步结果选择特定的细胞系进行进一步研 ...

  • 我研究的基因在细胞系当中的表达情况如何?

    相信大家都听说过CCLE(Cancer Cell Line Encyclopedia)(https://portals.broadinstitute.org/ccle).简单来说,这个数据库做了很多细 ...

  • 肿瘤细胞系综合性分析数据库

    在昨天的推送当中,我们介绍了现在的 CCLE 数据库的一些基本信息.同时也提到了一个用来分析 CCLE 的在线的数据库:DepMap Portal (https://depmap.org/portal ...

  • 基因组CRISPR筛选数据库介绍

    前段时间一个汇总了多个基因组 CRISPR 数据的数据库:[[BioGRID ORCS-CRISPR筛选数据库]].同时之前也介绍了一个肿瘤细胞系相关的 CRISPR 数据库 [[DepMap Por ...

  • 学徒作业:TCGA数据库单基因gsea之COAD-READ

    发表在Cancer Management and Research的简单数据挖掘杂志:Apolipoprotein C1 (APOC1) promotes tumor progression via ...

  • 学徒作业-指定基因在指定组织里面的表达量热图

    昨天我在生信技能树发布了一个学徒作业:在CCLE数据库里面根据指定基因在指定细胞系里面提取表达矩阵 , 真的是非常简单,只需要下载CCLE数据库的RNA-seq表达矩阵,然后在R里面根据指定基因在指定 ...

  • 学徒作业:给你8个甲基化探针, 你在tcga数据库进行任意探索

    我喜欢把TCGA数据库的应用划分为8个领域: 1.探索各类肿瘤不同临床特征(性别.年龄.种族.临床分期)的预后(生存曲线) 2.探索各类肿瘤与对照的单个分子(mRNA,lncRNA,miRNA,甲基化 ...

  • 上次说的gmt函数(学徒作业)

    最近我们的学徒作业,都是以公众号推文的方式发布出来,希望更多人加入一起学习,前面两次的作业是: 写一个函数把基因集,写出成为gmt文件.详见:GSVA或者GSEA各种算法都是可以自定义基因集的 自行读 ...

  • Agilent芯片表达矩阵处理(学徒作业)

    Agilent的芯片同样也是扫描得到图片,然后图像处理(主要是Agilent Feature Extraction (AFE) 软件)得到信号值,但是值得注意的是这个时候有两个信号值矩阵,分别是:th ...

  • 学徒作业-我想看为什么这几个基因的表达量相关性非常高

    不知道多少人看完了全网第一个单细胞课程(免费基础课程),免费学习地址在B站:https://www.bilibili.com/video/av38741055  而且完成结业考核20题:https:/ ...

  • 学徒作业-两个基因突变联合看生存效应

    我喜欢把TCGA数据库的应用划分为8个领域: 1.探索各类肿瘤不同临床特征(性别.年龄.种族.临床分期)的预后(生存曲线) 2.探索各类肿瘤与对照的单个分子(mRNA,lncRNA,miRNA,甲基化 ...

  • 学徒作业-根据我的甲基化视频教程来完成2015-NPC-methy-GSE52068研究

    文章数据分析流程图如下: 任务 如果你有R代码基础,那么你可能需要阅读我在生信技能树的甲基化教程列表: 01-甲基化的一些基础知识.pdf 02-甲基化芯片的一般分析流程.pdf 03-甲基化芯片数据 ...

  • RNA芯片和测序技术的比较(学徒作业)

    有学员提出来了一个问题,就是可以比较同样实验设计的表达量探索研究,一个研究使用的是芯片,一个是测序,看看两者的差异基因情况的overlap情况.其实这样的例子非常多,比如下面这样的展现方式: 下面给大 ...