公开课-单细胞数据基础分析
因为钉钉群名额有限,先到先得!废话不多说,赶紧下载钉钉软件搜索 “单细胞2021公开课”群的钉钉群号:35936686,加入吧!
本次公开课带领大家入门基础10X单细胞转录组数据分析,参考教程为Seurat包的官方教程:https://satijalab.org/seurat/articles/pbmc3k_tutorial.html
它需要10X单细胞转录组数据的cellranger结果文件,我们也是在单细胞天地公众号详细介绍了cellranger全部使用细节及流程,大家可以自行前往学习,如下:
单细胞实战(一)数据下载 单细胞实战(二) cell ranger使用前注意事项 单细胞实战(三) Cell Ranger使用初探 单细胞实战(四) Cell Ranger流程概览 单细胞实战(五) 理解cellranger count的结果 更新版本见:cellranger更新到4啦(全新使用教程)
因为这个cellranger上游数据分析流程对服务器要求比较高,而且10x的原始测序fastq文件也是接近100G文件,运行过程对技术资源消耗比较大,我们公开课没办法承担这个成本。所以大家直接下载其官方示例提供的 https://cf.10xgenomics.com/samples/cell/pbmc3k/pbmc3k_filtered_gene_bc_matrices.tar.gz 结果文件即可,后续跟课都是在自己的电脑里面操作,主要是统计可视化。
基本流程如下:
代码在:https://satijalab.org/seurat/articles/essential_commands.html
Seurat Standard Worflow
pbmc.counts <- Read10X(data.dir = "~/Downloads/pbmc3k/filtered_gene_bc_matrices/hg19/")
pbmc <- CreateSeuratObject(counts = pbmc.counts)
pbmc <- NormalizeData(object = pbmc)
pbmc <- FindVariableFeatures(object = pbmc)
pbmc <- ScaleData(object = pbmc)
pbmc <- RunPCA(object = pbmc)
pbmc <- FindNeighbors(object = pbmc)
pbmc <- FindClusters(object = pbmc)
pbmc <- RunTSNE(object = pbmc)
DimPlot(object = pbmc, reduction = "tsne")
虽然是seurat官方文档代码讲解,但是呢,本次课程的亮点与官网又有一点不一样。由于每天都会看见很多人在群里问,如何提取各种值,那么本次公开课会带领大家详细解剖Seurat对象,让大家不再迷茫于如何提取count值,normalized值,scaled值等内容!
其实Seurat对象也没有那么神秘,类似于下面的这样的SingleCellExperiment对象的结构!
图来源:http://bioconductor.org/books/release/OSCA/data-infrastructure.html