AD 单细胞测序
当你的才华还撑不起你的野心时,请潜下心来,脚踏实地,跟着我们慢慢进步。不知不觉在单细胞转录组领域做知识分析也快两年了,通过文献速递这个栏目很幸运聚集了一些小伙伴携手共进,一起成长。
文献速递栏目通过简短介绍,扩充知识面,每天关注,希望你也能有所收获!
摘 · 要
本文分析了具有不同程度的阿尔茨海默病病理学的48个前额皮质,通过10x总共测了80,660个单核转录组。在目前的六种主要的脑细胞类型中,鉴定出了与髓鞘形成等相关的亚群,并且这些细胞亚群具有性别差异。
上游分析
在ROSMAP项目中,收集了24个具有AD病理的病人作为实验组和24个没有AD病理的人作为对照组。10X建库测序后,用cellranger2.0,处理。参考基因组是hg38 genome (GRCh38.p5)的pre-mRNA(因为是测的核)。
质控
原始数据包含 80,660 cells,平均每个细胞测到的reads为1.5k,筛选条件是通过tSNE降维展示得到的,检测到的outlier细胞被移除,最终得到了 17,926genes 和 75,060 nuclei.
聚类分析
用SCANPY package分析质控后得到的17,926genes cross 75,060 nuclei,使用的是scanpy包对表达矩阵进行归一化,挑选3,188 高变化基因,使用top10的PC进行分类,初步分类是:20 pre-clusters with a median number of 2,990 cells, ranging from 413 to 15,900 cells。在获得出本分类后,再取出每个cluster的前500个gene进行亚分类,操作与初步分类一致。
细胞亚型分型
细胞亚型分类是基于临床表型和AD病理特征进行定义的。具体做法是通过使用超几何分布(Fisher精确检验)和 over all gene sets and sub-clusters 的FDR校正来评估富集,并通过R包metap 计算meta-pvalue来aggregate P值。所用到的marker是通过对指定cluster和剩余cluster进行差异分析,定义差异的条件如图所示:
最后通过gProfileR包对markers进行GO分析。
单细胞与Bulk数据的一致性分
文章中使用了两种方法对单细胞进行差异分析:秩和检验与FDR多重矫正和使用R包lme4和RUV-seq计算的泊松混合模型。通过比较两个模型中DEG的方向性和等级,选取方向一致的差异基因(通过模型计算,排除了偶然事件)。
然后,通过R 包limma在排除了covariates age, RNA integrity number, post-mortem interval, and plate batches等因素的影响后对bulk数据进行了差异分析。并将bulk数据获得的差异基因与单细胞数据观察到的在不同细胞类别中具有扰动的基因进行比较,获得bulk数据与单细胞数据的一致性。
其他分析
1.SOMs基因表达与AD相关神经病理学特征的相关性分析。是通过kohonen R包构建SOM,然后与其他临床表型等因素进行相关性分析
2.对来自ROSMAP cohort studies的白质数据的统计分析。文章中有描述,这里就不赘述了。
总结
这是第一篇将单细胞技术应用AD中的文章。我觉得除了本身的临床意义外,这篇文章将AD病理学和transcriptional alterations相关联,还将单能细胞和bulk数据结合是一大亮点。顺利揭示了在不同细胞类型中特异性的和病理状态下共享的gene-expression perturbations。