BRCA1和BRCA2基因敲除小鼠的单细胞转录组

看到于2020年11月发表在杂志《nature cancer》的文章:《Mutations in BRCA1 and BRCA2 differentially affect the tumor microenvironment and response to checkpoint blockade immunotherapy》里面有基于10X的单细胞转录组测序数据,文献链接是:https://www.nature.com/articles/s43018-020-00139-8

上游数据分析

数据在  https://www.ncbi.nlm.nih.gov/bioproject/PRJNA632854 :

需要自行下载这些数据,参考我在《生信技能树》的教程:cellranger更新到4啦(全新使用教程)

目前单细胞转录组以10X公司为主流,我们也是在单细胞天地公众号详细介绍了cellranger流程,大家可以自行前往学习,如下:

但是这个两年前的系列笔记是基于V2,V3版本的cellranger,目前呢它更新到了版本4,建议以我的最新版教程为准,在《生信技能树》的教程:cellranger更新到4啦(全新使用教程)

如果计算机资源ok的话,基本上下载这些数据需要一两天,走cellranger流程需要一两天,就可以拿到表达矩阵了。其实作者也上传了:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE137818 可以把自己的表达矩阵跟作者的进行对比:

GSM4088924 Mouse 4T1 Brca2 KO Untreated single cell RNA-seq Rep 1
GSM4088925 Mouse 4T1 Brca2 KO Untreated single cell RNA-seq Rep 2
GSM4088926 Mouse 4T1 Brca2 KO Untreated single cell RNA-seq Rep 3
GSM4088927 Mouse 4T1 Brca1 KO Untreated single cell RNA-seq Rep 1
GSM4088928 Mouse 4T1 Brca1 KO Untreated single cell RNA-seq Rep 2
GSM4088929 Mouse 4T1 Parental (BRCA WT) Untreated single cell RNA-seq Rep 1
GSM4088930 Mouse 4T1 Parental (BRCA WT) Untreated single cell RNA-seq Rep 2
GSM4088931 Mouse 4T1 Parental (BRCA WT) Untreated single cell RNA-seq Rep 3

但是它给出来的并不是原始的3文件,而是  GSE137818_scRNA_logcounts.csv.gz 一个整合好的表达矩阵。

这样的分群是不是比较简陋

假如你没有技术资源都这个上游分析,直接拿到GSE137818_scRNA_logcounts.csv.gz 这个整合好的表达矩阵走下游分析也可以。大家不要看到我们的教程提到10x单细胞转录组需要3个文件才能载入seurat就不懂得变通了,表达矩阵本身比3个文件更方便读入。不过也有一些比较特殊的文献,甚至使用了还有一些作者上传h5文件,需要使用特殊的函数了:

Read10X_h5: Read 10X hdf5 file
In Seurat: Tools for Single Cell Genomics

Description
Read count matrix from 10X CellRanger hdf5 file. This can be used to read both scATAC-seq and scRNA-seq matrices.

载入表达矩阵后的降维聚类分群,看我在《单细胞天地》的单细胞基础10讲:

文章的第一次分群,如下:

很有意思,里面的14-16,21-23,这6群细胞作者直接就命名为ambiguous了,然后剩余的细胞都是免疫相关的细胞亚群,包括淋巴系的T,B,NK等等,以及髓系的DC,macrophage这样的myeloid细胞。

然后单独对myeloid拿出来细分亚群的时候,又是很有意思的,感觉是很粗糙:

并不需要给出具体的细胞亚群生物学命名,仅仅是根据一些关键基因的高低表达很粗暴的二分类而已,这个代码实现起来就太简单了。

学徒作业有两个

首先是可以下载PRJNA632854数据集的fastq文件走cellranger流程拿到每个样品的3个文件,其次是可以直接使用GSE137818_scRNA_logcounts.csv.gz 这个整合好的表达矩阵走下游分析,拿到如上所示的两个聚类分群图。

(0)

相关推荐

  • 短综述 | Current Opinion in Pharmacology:利用单细胞转录组解决纤维化

    编译:Echo,编辑:十九.江舜尧. 原创微文,欢迎转发转载. 导读 纤维化是各种因素(生物因素.化学因素.物理因素等)损伤作用下导致细胞外基质的异常合成增加和(或)降解不足所引起的病理过程,是全球医 ...

  • IF 14 非肿瘤的顶刊单细胞套路,亮点在这里!

    探索生信之美,解构每一篇文章的故事 解读高分文章,揭示生信之美~小伙伴们大家好啊,我是风间琉璃.经历了短暂快乐的春节,大家是不是已经回到实验室或者医院继续开始工作了呢?(反正琉璃已经回到临床默默打工了 ...

  • 科研 | JACC:AntimiR-21可预防缺血/再灌注猪模型中的心肌功能障碍

    编译:思越,编辑:十九.江舜尧. 原创微文,欢迎转发转载. 导读 心肌缺血后心力衰竭(HF)是住院和死亡的常见原因,miR-21作为心脏纤维化的中央调节器,已经在小型动物模型中证明其作为治疗纤维化的靶 ...

  • 单细胞RNA

    一.单细胞single cell RNA-seq简介 1.Bulk RNA-seq(大量RNA-seq) Measures the average expression level for each ...

  • MC4R基因敲除小鼠模型介绍

    MC4R基因敲除小鼠基本信息 品系名称:B6.Mc4rem1 /Vst 常用名:Mc4r KO; C57BL/6- Mc4r KO MC4R基因敲除小鼠背景:C57BL/6NCrl 毛色:黑色 MC4 ...

  • NPG-Fah基因敲除小鼠模型介绍

    基本信息 品系名称:NPG- Fahem1Vst /Vst 常用名:NPG-Fah敲除小鼠:Fah敲除小鼠 背景:NOD 毛色:白色 品系建立: 小鼠Fah基因位于7号染色体,采用CRISPR-Cas ...

  • Cpf1完全性基因敲除小鼠模型介绍

    CRISPR-Cpf1系统,,又叫Cas12a,是一类新型的CRISPR-Cas基因编辑工具,它扩大了基因编辑靶位点的选择范围,同时几乎没有脱靶效应.与CRISPR/Cas9基因编辑系统相比,CRIS ...

  • SaCas9完全性基因敲除小鼠模型

    CRISPR/Cas9基因编辑技术( Clustered Regularly Interspaced Short Palindromic Repeats) 是一种由gRNA介导Cas9蛋白核酸酶特异靶 ...

  • PTEN基因敲除小鼠模型介绍

    今天我们要讲的主角是抑癌基因PTEN. 1 PTEN基因研究概况 PTEN是迄今发现的第一个具有双重特性磷酸酶活性的肿瘤抑制基因,有脂质磷酸酶和蛋白磷酸酶双重特异性,在细胞内多条信号传导途径调控中起着 ...

  • COL4A5基因敲除小鼠模型构建

    今天我们要讲的主角是Alport综合症致病基因之一COL4A5. 基因基本信息 COL4A5基因研究概况 COL4A5是编码IV型胶原蛋白的六个基因之一,这种蛋白胶原肽是细胞膜的重要基质之一.该基因位 ...

  • Lepr基因敲除小鼠模型介绍

    基因敲除小鼠是什么?是否就是我们平日所说的实验室用的小白鼠?其实小鼠有很多种,小白鼠只是其中一种,通常普通的小白鼠多被药厂用作临床试验,而基因敲除的小鼠,则用于更尖端的生物医学研究. 基因敲除小鼠技术 ...

  • Glp1r基因敲除小鼠模型介绍

    基因敲除小鼠是什么?是否就是我们平日所说的实验室用的小白鼠?其实小鼠有很多种,小白鼠只是其中一种,通常普通的小白鼠多被药厂用作临床试验,而基因敲除的小鼠,则用于更尖端的生物医学研究. 基因敲除小鼠技术 ...

  • Fndc5基因敲除小鼠模型介绍

    基因敲除小鼠是什么?是否就是我们平日所说的实验室用的小白鼠?其实小鼠有很多种,小白鼠只是其中一种,通常普通的小白鼠多被药厂用作临床试验,而基因敲除的小鼠,则用于更尖端的生物医学研究. 基因敲除小鼠技术 ...