scRNA-seq Clustering quality control(二)

回顾

单细胞RNA-seq分析介绍
单细胞RNA-seq的设计和方法
从原始数据到计数矩阵
差异分析前的准备工作
scRNA-seq——读入数据详解
scRNA-seq——质量控制
为什么需要Normalization和PCA分析
scRNA-seq聚类分析(一)
scRNA-seq聚类分析(二)
scRNA-seq Clustering (一)
scRNA-seq Clustering (二)
scRNA-seq Clustering quality control(一)

探索已知的细胞类型标记

根据细胞的分群,我们可以通过寻找已知的标记来探索细胞类型的特性。图中显示带有标记的群集的UMAP图,后面跟着预期的不同细胞类型。

DimPlot(object = seurat_integrated, 
        reduction = "umap", 
        label = TRUE) + NoLegend()

通过来自Seurat的 FeaturePlot() 函数,可以使用存储在Seurat对象中的基因ID轻松地可视化少数几个基因。例如,如果我们对探索已知的免疫细胞标志物感兴趣,如:

Seurat的FeaturePlot()函数使我们可以轻松地在UMAP可视化基础上探索已知标记。让我们仔细研究群集的类型。如果要获得所有基因的表达水平,而不仅仅是3000个高度可变的基因,我们可以使用存储在RNA分析槽中的normalized计数数据。

# Select the RNA counts slot to be the default assay
DefaultAssay(seurat_integrated) <- "RNA"

# Normalize RNA data for visualization purposes
seurat_integrated <- NormalizeData(seurat_integrated, verbose = FALSE)

我们正在寻找跨群集的标记表达的一致性。例如,如果一种细胞类型有两个标记,并且只有一个标记在一个群集中表达,那么我们就不能可靠地将该群集定义为该细胞类型。

CD14+ monocyte markers

FeaturePlot(seurat_integrated, 
            reduction = "umap", 
            features = c("CD14", "LYZ"), 
            sort.cell = TRUE,
            min.cutoff = 'q10', 
            label = TRUE)

CD14+单核细胞似乎对应于群集1、3和14。我们不包括簇9和15,因为它们并不高度表达这两个标记。

FCGR3A+ monocyte markers

FeaturePlot(seurat_integrated, 
            reduction = "umap", 
            features = c("FCGR3A", "MS4A7"), 
            sort.cell = TRUE,
            min.cutoff = 'q10', 
            label = TRUE)

FCGR3A+单核细胞标志物在群集9明显高表达。

Macrophages

FeaturePlot(seurat_integrated, 
            reduction = "umap", 
            features = c("MARCO", "ITGAM", "ADGRE1"), 
            sort.cell = TRUE,
            min.cutoff = 'q10', 
            label = TRUE)

似乎没有与巨噬细胞相对应的群集;也许细胞培养条件对巨噬细胞的选择是负面的(更高黏附性)。

Conventional dendritic cell markers

FeaturePlot(seurat_integrated, 
            reduction = "umap", 
            features = c("FCER1A", "CST3"), 
            sort.cell = TRUE,
            min.cutoff = 'q10', 
            label = TRUE)

群集15对应于常规树突状细胞的标记识别(两个标记一致地显示表达)。

Plasmacytoid dendritic cell markers

FeaturePlot(seurat_integrated, 
            reduction = "umap", 
            features = c("IL3RA", "GZMB", "SERPINF1", "ITM2C"), 
            sort.cell = TRUE,
            min.cutoff = 'q10', 
            label = TRUE)

群集19对应浆细胞样树突状细胞。虽然这些标记物的表达有很大的差异,但我们看到群集19的表达是一致的。


练习

探究表中每个不同的细胞类型对应的群集

注意:如果任何集群似乎包含两个独立的细胞类型,那么提高群集分辨率以正确划分群集是很有帮助的。或者,如果我们仍然不能使用更高的分辨率分离出群集,那么可能是我们使用的主成分太少,以至于我们没有分离出这些感兴趣的细胞类型。为了给我们选择PC提供信息,我们可以查看与UMAP图重叠的PC基因的表达,并确定我们的细胞群体是否被包括在内的PC分开。

练习答案

B cell markers

FeaturePlot(seurat_integrated, 
            reduction = "umap", 
            features = c("CD79A", "MS4A1"), 
            sort.cell = TRUE,
            min.cutoff = 'q10', 
            label = TRUE)

群集6、11和17具有良好的B细胞标志物表达。这与基于驱动PC2的基因的假设相对应。

T cell markers

FeaturePlot(seurat_integrated, 
            reduction = "umap", 
            features = c("CD3D"), 
            sort.cell = TRUE,
            min.cutoff = 'q10', 
            label = TRUE)

除第7、8、12和16群外,所有T细胞标记都集中在绘图右侧的一大群群中。

CD4+ T cell markers

FeaturePlot(seurat_integrated, 
            reduction = "umap", 
            features = c("CD3D", "IL7R", "CCR7"), 
            sort.cell = TRUE,
            min.cutoff = 'q10', 
            label = TRUE)

与CD4+T细胞相对应的T细胞亚群是群集0、2、4、10和18。我们在其他群集中也看到了表达,但这些群集不表达高水平的T细胞标记CD3D。

CD8+ T cell markers

FeaturePlot(seurat_integrated, 
            reduction = "umap", 
            features = c("CD3D", "CD8A"), 
            sort.cell = TRUE,
            min.cutoff = 'q10', 
            label = TRUE)

对于CD8+T细胞,在群集5和13观察到两个标记唯一一致的表达。

NK cell markers

FeaturePlot(seurat_integrated, 
            reduction = "umap", 
            features = c("GNLY", "NKG7"), 
            sort.cell = TRUE,
            min.cutoff = 'q10', 
            label = TRUE)

除了第5群外,NK细胞标记物还在第8和第12群中表达;然而,我们知道群集5表达T细胞标记物。所以我们假设第5群集可能是激活的CD8+T细胞。

Megakaryocyte markers

FeaturePlot(seurat_integrated, 
            reduction = "umap", 
            features = c("PPBP"), 
            sort.cell = TRUE,
            min.cutoff = 'q10', 
            label = TRUE)

巨核细胞标志物似乎主要在第16群集表达。

Erythrocyte markers

FeaturePlot(seurat_integrated, 
            reduction = "umap", 
            features = c("HBB", "HBA2"), 
            sort.cell = TRUE,
            min.cutoff = 'q10', 
            label = TRUE)

似乎没有红血球群集,因为标记分布在不同类型的细胞上。这不是一件坏事,因为血细胞通常是要从分析中排除的细胞类型,因为它们通常不能提供有关感兴趣条件的信息。

基于这些结果,我们可以将群集与细胞类型相关联。然而,在对细胞类型执行群集的最终分配之前,我们希望使用标记识别来执行更深层次的分析。


现在我们对与大多数群集相对应的细胞类型有了一个很好的了解,但一些问题仍然存在:

  • 群集7和20的细胞类型是什么?
  • 与相同细胞类型相对应的群集是否有生物学意义的差异?这些细胞类型有亚群吗?
  • 我们是否可以通过识别这些群集的其他标记基因来获得对这些细胞类型特性的更准确的识别?

标记识别分析可以帮助我们解决所有这些问题!!

下一步将是进行标记识别分析,这将输出不同群集之间表达显著差异的基因。使用这些基因,我们可以确定或提高对群集/子群集身份的置信度。

未完待续......


(0)

相关推荐

  • 单细胞Marker基因可示化包Nebulosa

    与传统的转录组测序相比,单细胞测序技术噪声很大,使得单细胞转录组数据包含大量的dropout事件(导致基因表达量为0或接近0),即使是一些标记(Marker)基因也有可能表达量很低.当在使用其对聚类的 ...

  • 14种单细胞测序去批次效应哪家强

    A benchmark of batch-effect correction methods for single-cell RNA sequencing data对单细胞RNA测序数据的批次效应校正 ...

  • 单细胞工具箱|Seurat官网标准流程

    学习单细胞转录组肯定先来一遍Seurat官网的标准流程. 数据来源于Peripheral Blood Mononuclear Cells (PBMC),共2700个单细胞, Illumina Next ...

  • scRNA-seq Clustering quality control

    回顾 单细胞RNA-seq分析介绍 单细胞RNA-seq的设计和方法 从原始数据到计数矩阵 差异分析前的准备工作 scRNA-seq--读入数据详解 scRNA-seq--质量控制 为什么需要Norm ...

  • 原创 | 一文读懂快速反应与质量控制Quick Response & Quality Control...

    最新课程 前言 本文作者:姜传武 亲爱的朋友,你在分析和解决一个问题时,是否熟悉下列情景? · 当接到客诉某个问题时,没有半点蛛丝马迹就火速停线.100%做挑选! · 得不到不良品,看不到具体的问题是 ...

  • OSCA单细胞数据分析笔记-5 Quality control

    对应原版教程第6章  http://bioconductor.org/books/release/OSCA/overview.html 在单细胞数据分析中的第一步质控往往是剔除不合格的细胞.本小节主要 ...

  • scRNA-seq Clustering(二)

    回顾 单细胞RNA-seq分析介绍 单细胞RNA-seq的设计和方法 从原始数据到计数矩阵 差异分析前的准备工作 scRNA-seq--读入数据详解 scRNA-seq--质量控制 为什么需要Norm ...

  • 【博文连载】PCIe扫盲——Flow Control基础(二)

    在任何事务层包(TLP)发送之前,PCIe总线必须要先完成Flow Control初始化.当物理层完成链路初始化后,便会将LinkUp信号变为有效,告知数据链路层可以开始Flow Control初始化 ...

  • 求索与探疑:中国音乐史学发展的动力(二)——陈聆群、陈应时二位先生于学科建设的功绩和感怀

    作者:洛 秦 内容提要 陈聆群.陈应时教授是我的老师和同事,提携和指引我走上学术道路.与二位先生学术共事的30多年经历,让我更清晰地看到他们对中国音乐史学的发展所作出的贡献.陈聆群先生是一位中国近现代 ...

  • 读懂十二时辰,就懂了我们的一生

    十二时辰是古人根据一日间太阳出没的自然规律.天色的变化以及自己日常的生产活动.生活习惯而归纳总结.独创于世的.十二时辰制,西周时就已使用.古人把一昼夜划分成十二个时段,每一个时段叫一个时辰.十二时辰既 ...

  • 44张照片,告诉你二战前世界的样子

    1939年,轴心国与同盟国宣布开战,此前的几年间,全球的人们陷于疯狂与骚动之中,这也成了大战爆发的前奏. 第二次中日战争期间的1937年,一名日本兵在守卫一段占据的中国长城(国会图书馆). 自1931 ...

  • 食道癌饮食不下-噎启膈通二味小方之效

    噎启膈通--给食道癌临床治疗提供了一个很好的思路. 高龄老人食道癌,虑其年已八旬,施以手术恐体弱无法承受,初行放疗数次亦不堪受,转求中医诊治.一小方:灵芝.威灵仙,二药等量,煎汤代茶,频频呷服,以期暂 ...