科研 | Scientific Data:人肾脏单细胞RNA测序(国人作品)
编译:贤,编辑:十九、江舜尧。
原创微文,欢迎转发转载。
论文ID
原名:Single-cell RNA sequencing of human kidney
译名:人肾脏单细胞RNA测序
期刊:Scientific Data
IF:5.929
发表时间:2020.1
通讯作者:程继文、莫曾南
通讯作者单位:广西医科大学
DOI号:10.1038/s41597-019-0351-8
实验设计
从医院获取三份样品(肾脏1、2和3)后放入含汉克平衡盐溶液中冰浴,切开0.5-1.0 g全层肾炎组织,将其放置在不锈钢细胞过滤器上,用注射器的柱塞将组织压碎。杜尔贝科磷酸盐缓冲盐溶液清洗两遍,收集,弃去上清液,用TrypLE Express酶消化,然后使用杜尔贝科改良的Eagle培养基终止消化。离心,弃去上清液,加入5毫升DPBS复溶并过滤。滤液使用红细胞裂解缓冲液提取红细胞5分钟,离心,弃去上清液,再加入5毫升DPBS复溶并过滤。然后,稀释每个样本的适当体积,回收10000个肾细胞。随后,将单细胞悬液、凝胶珠和油添加到10x基因组学的单细胞A芯片中。液滴生成后,将样品进行逆转录获取cDNA, cDNA扩增10个周期后,开始测序(图1a)。
(a)人肾脏组织样品的scRNA-seq过程
(b)UMAP和tSNE图显示了肾细胞的无偏分类。
(c)每种肾细胞类型的比例饼图。
(d)显示每个簇的标记基因热图。
结果
1. 测序结果质量控制
细胞的筛选标准研究使用MergeSeurat函数来合并三个肾脏数据集,根据肾脏样本中基因的中位数和线粒体基因的百分数(图2a),筛选了具有小于200和大于2500个基因的细胞和过滤掉含30%以上线粒体基因的细胞。由于这些数据来自三个不同的样本,为了避免批次效应影响下游分析,采用了一种缓解批次效应的策略(Harmony)。为了确保分析的可靠性,还采用了另一种近邻算法(MNN),发现这两种消除批次效应的方法产生了相似的结果(图2c)。因此,使用Harmony来消除批量影响并继续进行下游PCA分析,并基于jackStraw函数识别出显著主成分(PCs)。
图2 人肾单细胞数据的质量控制
(a)三个肾脏样本中每个细胞中的基因数量散点图。
(b)线粒体基因的百分比与mRNA读数之间的关系。
(c)三个不同肾脏样品之间的批次效应。
(d)每个细胞的细胞周期状态UMAP图。
(e)来自GSE107585的先前肾脏单细胞数据中的基因数量小提琴图
2. 聚类分析
经质量控制后,共获得23366个高质量的肾细胞,这些细胞可以分为10个细胞簇,每个簇由79-11539个细胞的细胞组成(图1c),并使用两种不同的方法(UMAP和tSNE)可视化了细胞聚类,两者得到结果相同(图1b)。这10类细胞簇分别对应于近曲小管细胞,近端小管细胞,近端直小管细胞,NK-T细胞,单核细胞,肾小球壁上皮细胞,远端小管细胞,集合管主细胞,B细胞和集合管插层细胞(图1d)。结果显示,PT(近端小管)细胞非常丰富,高达20308个,根据标记,PT细胞可分为三个不同的部分,包括近曲小管、近直小管和未准确分类的PT细胞(图1b,3a)。
3. 差异基因分析
共检测了三个不同肾脏样本之间的批次效应(图2c),当分辨率为0.25时,由FindClusters函数进行聚类,得到10种不同的类型,然后利用findallmarker函数寻找不同类型细胞间的差异表达基因。采用Seurat方法选择了三种类型的PT细胞,包括20308个PT细胞在内的数据被导入Monocle2。使用的基因至少在10个细胞和大于5%的细胞中表达。随后,使用细胞局部密度(rho)和最近距离(delta)的阈值来确定集群的数量。然后,在所有的细胞群中进行了差异基因表达分析。使用前1000个差异表达最显著的基因(PCs)作为有序基因集,并进行降维和轨迹分析。
分析后提出了一种细胞亚群的详细分类方法。首先选择20个PCs和0.25分辨率的参数来识别10种细胞类型(图1b)时,cluster 4是NK细胞和T细胞的高表达标记基因,被指定为NK-T细胞(图1d)。而cluster 4可以进一步分为两个子类(图4b)。当将参数修改为20个PCs,分辨率为0.8时,就可以准确地分辨NKT细胞(CD3D+CD3E+GNLY+NKG7+)和T细胞(CD3D+CD3E+IL7R+)(图4c-g),可用于下游分析的方法。
图4 通过scRNA-seq对集合管主细胞和NK-T细胞详细分类图
(a)集合管主细胞标记AQP2和集合管插层细胞标记ATP6V1B1,ATP6V0D2和ATP6V1G3的表达小提琴图。簇8和10分别是收集导管主细胞和收集导管插入的细胞。
(b)UMAP图显示降维后NKT细胞和T细胞的空间位置。红点代表NKT细胞,绿点代表T细胞。
(c–g)NK细胞标记GNLY和NKG7的表达小提琴图。
4. 比较分析
将之前GSE107585的肾脏单细胞数据与每个细胞检测到的基因数量进行比较(图2e)后,发现每个细胞的中位基因数是941个,这与个本文研究的scRNA-seq结果比较接近。
集合管最初被认为只在水的再吸收中起作用,而近年来对集合管功能的认识有了很大的提高,为肾小管远端如何进行盐和水的再吸收、钾的稳态和酸碱状态提供了新的模型,同时,也为集合管细胞提供了转录组信息(图1b,cluster 8, 10)。根据标记表达,可将集合管细胞分为主细胞(cluster 8)和插层细胞(cluster 10)(图4a)。考虑到这三个“健康”的肾脏样本是来自于肾癌患者,必须确认它们的普遍代表性,通过许多以往对人肾scRNA-seq在近端、远端和集合管细胞的标记基因的研究,发现几乎所有的PT细胞基因都在本研究的PT细胞中高度表达。这些用于集合远端小管细胞的基因大部分在本文数据中表达。因此,这些结果是可靠的。
5. 细胞周期分析
使用Seurat程序对之前定义的43个G1/S和54个G2/M细胞周期基因核心集进行细胞周期分析。以两组基因的最大平均表达量对细胞进行分类。当G1/S和G2/M的循环积分均小于2时,认为这些细胞是非循环的。否则,认为细胞是增殖的。细胞周期分析后,未见细胞周期基因引起的偏倚(图2d)。
6. PT细胞分化轨迹分析
使用差分Gene Test函数查找具有随伪时间(pseudo-time)变化的基因,并建立PT细胞分化轨迹。通过应用Monocle2来执行所有PT细胞的伪时间轨迹来显示它们之间的命运决定(图3b-e),发现了影响命运决定的前六个基因(图3f)。并展示了影响命运决定的前50个基因(图3g)。
图3 PT细胞亚群及PT细胞的发育轨迹
(a)标记基因在PT细胞中表达的小提琴图。聚类1、2和3分别指近曲小管,近端小管和近直小管。
(b)Monocle2生成的三种PT细胞类型的伪时间轨迹(n = 20,308)。
(c)伪时间的颜色从深到浅蓝色渐变。
(d)伪时间轨迹被Monocle2分为三个不同的状态。
(e)三个样本中细胞分布的轨迹。
(f)影响命运决定的前六个基因。
(g)影响细胞命运决定的前50个基因进行聚类的热图。这50个基因被分为三个簇(簇1,簇2和簇3),分别显示了发育轨迹的开始阶段,过渡阶段和结束阶段的基因。
评论
本研究获得了23,366个高质量人肾细胞的单细胞转录组数据,提供了人类肾脏细胞的转录组图谱;为肾小管细胞的准确分类以及研究肾小管细胞与疾病之间的关系提供了重要的参考,此外还将有助于研究肾脏细胞生物学以及细胞类型与疾病之间的关系。
更多推荐
1 科研 | PNAS:转录组学揭示急性和慢性饮酒对肝脏昼夜新陈代谢有不同的影响