科研 |Nature Communication:利用单细胞测序技术确定人类乳腺上皮细胞的多样性

编译:小北,编辑:夏甘草、江舜尧。

原创微文,欢迎转发转载。

导读

乳腺癌是乳腺上皮细胞基因突变导致的组织内稳态丧失产生的。一些不同的上皮亚群已经发现,但是对人类乳腺异质性和分化等级尚未全面理解。本研究中作用利用单细胞mRNA-seq(scRNA-seq)技术对七个个体乳腺缩小中分离得到的25,790个人类乳腺上皮细胞进行转录组图谱绘制,无偏差聚类分析结果表明3个不同的上皮细胞群体存在一种基底细胞两种管腔细胞,在这两种管腔细胞中确定了分泌L1-的和激素响应的L2-型细胞。分化轨迹的假颞叶重塑产生一个连续的种系,更接近于从基底种系向两个分化的管腔分枝。综合的细胞图谱有利于洞察人类乳腺上皮细胞内的蓝图并且为理解乳腺癌发生过程中系统异常提供基础。

论文ID

原 名:Profiling human breast epithelial cells using single cell RNA sequencing identifies cell diversity

中文名称:利用单细胞测序技术确定人类乳腺上皮细胞的多样性

期刊:Nature Communication

影响因子:11.878

发表时间:2018年5月23日

作者:Zena Werb、Kai Kessenbrock1

单位:加州大学

DOI:10.1038/s41467-018-04334-1

前言

乳腺癌是高度异质性的疾病,依据组织形态和分子特征分群。目前至少已经确定了6个乳腺癌的亚群,分别命名为luminal A、luminal B、HER2-enriched、basal-like、normal breast、claudin-low2,近期确定了高达10个亚群。推测每个亚群都由不同的细胞起源。然而,对细胞大范围的异质性以及不同细胞类型的理解瓶颈是探究人类乳腺上皮细胞对肿瘤起始和发展过程中的作用。
乳腺癌由乳腺上皮细胞产生,乳腺上皮细胞构成了导管网络嵌入脂肪组织,并且通过聚集导管形成一个复杂的系统,在怀孕和哺乳时期产生乳液。整个导管小叶系统,乳腺上皮由两个已知的细胞类型构成,分泌管腔细胞的内层和基底/肌上皮的外层。一系列的报道指出在小鼠的这两种细胞分层中存在异质性。2006年发表的标志性文章发现基底上皮细胞功能不同的亚群具有干细胞的特性并且当植入小鼠的乳房脂肪垫时能够重塑乳腺上皮调控网络。此外,由KIT高表达的管腔祖细胞亚群与成熟的管腔细胞亚群利用FACS分离技术被确认。有趣的是,基于比较整体表达分析,这些腔内祖细胞能够提高三阴性乳腺癌BRCA1基因的突变。在乳腺上皮细胞中是否存在其他不同的细胞类型以及它们如何与已知的乳腺癌亚群相关联仍需进一步确定。

二代测序技术的优势以及基于微流体的细胞与反应物的处理使得研究者能够在单细胞的水平上探究细胞的异质性并且利用单细胞mRNA测序技术重塑种系等级。该方法能在一群细胞中利用个体的转录组重塑进行大范围异质性的无差别分析。scRNA-seq已经成功应用到对正常组织如肺、脑等,以及包括黑色素瘤、恶性胶质瘤和胰腺循环中的肿瘤细胞在内的多种癌症中复杂亚群的理解。

本研究旨在利用scRNA-seq建立人类乳腺上皮细胞亚群的分子普查。聚焦于乳腺上皮细胞,研究者的工作为绘制构成人体组织的大规模单细胞图谱提供了关键的第一推力,这也是国际人类细胞图谱计划的一部分。该分子图谱阐释了种系之间的关系、人类系统的分化轨迹以及其与乳腺癌如何关联。研究者的单细胞转录分析阐释了正常稳态条件下人类乳腺上皮细胞的异质性,这将作为理解在肿瘤早期及其发展过程中系统是如何改变的有益资源。

结果

scRNA-seq揭示了乳腺上皮细胞的三种细胞类型

研究者从年龄和种系匹配的青春期后和绝经前女性中收集了一组缩小的乳腺(附录1),并且对周围基质细胞利用流式依据CD49f和EpCAM的差异表达进行纯化,获取的乳腺上皮细胞进行scRNA-seq。基底细胞和管腔细胞经Fluidigm C1 技术嵌入微流体进入scRNA-seq平台(图1a)。经过显微成像对捕获的有效性进行检测以排除双液滴和碎片进行后续分析(SF1a、b)。研究者利用13个C1芯片从3个人类个体中捕获了868个细胞并进行测序。单细胞cDNA库以平均read深度为1.6M的reads/细胞平行测序。将检测的少于900个基因的细胞移除,并且经过质控过滤,研究者继续分析了703个细胞,每个细胞含约4500个基因在基底细胞和管腔细胞中的基因检测范围相当(SF 1c)。

为了确定个体乳腺上皮细胞中的主要细胞类型,研究者利用近期报道的Seurat pipeline对三个个体中的所有细胞进行联合分析,确定了三个不同的细胞集簇(图1b),说明乳腺上皮细胞由三个主要的细胞类型构成。研究者进一步探究了每个细胞集簇中显著上调的基因(图1c),揭示了这三个主要的细胞集簇与一个主要的基底细胞(KRT14+; AUC = 0.83)、两个管腔细胞,两者都能表达典型的标记物KRT8和KRT18。重要的是,在三个个体中都检测到了这三个细胞类型(SF1d)。研究者在这些管腔细胞中发现了一些不同的标记物,例如对于L1的SLPI (AUC = 0.89)、L2的ANKRD30A (AUC = 0.81)(SF1e)。将这些特征与之前发表的FACS分离的人类上皮细胞进行的微阵列表达分析比较,研究者发现与CD49f+/EpCAM+群体密切相关的L1称为腔内祖细胞,与CD49f−/EpCAM+群体类似称为成熟的管腔细胞,以及与CD49fhi/EpCAM− “Basal/MaSC”匹配的基底细胞。研究者进一步检测了基底细胞集簇。特别有趣的是,研究者观察到一个亚群能够高表达间充质干细胞的标记物ZEB120和TCF4(图1d)。有趣的是,之前的研究在间质细胞基因表达特征与MaSCot潜能之间建立了直接的联系,提示这些ZEB1/TCF4-表达的细胞代表了一组MaSC潜能升高的基底细胞。

图1利用scRNA-sq确定三个主要的上皮细胞类型和标记物。

液滴介导的scRNA-seq揭示了亚群的多样性

为了确定是否存在其他细胞的多样性,研究者接下来利用一个更加灵活的液滴介导的scRNA-seq平台(10× Genomics Chromium)。研究者聚焦于未产妇乳腺缩小的样本来降低与孕期相关乳腺的改变。研究者通过流式分离了管腔细胞和基底细胞(EpCAM+/CD49fhi/lo),作为一个样本进行基于液滴的scRNA-seq,该方法每个样本能够靶向5000个细胞(图2a)。研究者以每个细胞约60000的测序深度对四个个体中的24,646个细胞进行了测序。在质控过滤移除基因数<500以及高线粒体覆盖率>10%的细胞,利用Seurat对首个个体(Ind4)进行详细的聚类分析确定存在三个主要的上皮细胞类型,包括Basal (KRT14+), Luminal1 (L1; KRT18+/SLPI+)以及Luminal2 (L2; KRT18+/ANKRD30A+) (图2b)。所有的标记基因在附录2,这些数据也说明有3个额外的小集簇;集簇8由基质标记VIM (P < 9.6 × 10−25)定义;集簇9特异的表达内皮标记的基因ESAM (P < 4.1 × 10−30);集簇10包括一小部分分散的细胞最有可能代表异常值。经总结这些集簇(8-10)并不具有上皮的特性,并在今后的分析中将它们定义为非经典的(X)。

有趣的是,多个亚群在每个主要的上皮细胞中都有出现,依据它们不同的标记物基因表达特征(图2c)。研究者猜想细胞的主要岛(Basal, L1, L2)代表不同的细胞类型,而每个岛中的亚集簇揭示了随着时间的推移更加短暂的细胞状态。研究者在基底细胞中观察到了三个不同的细胞状态,表现出能够特异的表达炎症调节因子(IL24; P < 1.4 × 10−180; 集簇3)、肌上皮细胞功能的标记(ACTA2; P < 7.4 × 10−292; 集簇4)以及特异的上皮角蛋白表达(KRT17; P < 1.6 × 10−38;集簇5)。在微流体的scRNA-seq分析中一组基底细胞的标记基因ZEB1和TCF4很少被检测到,因此与微流体相比的低覆盖率,使基于液滴的scRNA-seq并不能解释。在管腔细胞L1中研究者观察到了三个不同的细胞状态:产奶相关基因表达(LTF; P < 8.4 × 10−270; 集簇1)、分泌分子的高表达(SAA2; P < 2.2 × 10−90; 集簇0)以及不同的上皮角蛋白表达(KRT23; P < 2.5 × 10−157; 集簇2)。第二种管腔细胞L2具有两种不同的细胞状态,以激素响应的基因表达(AGR2; P < 3.1 × 10−144; 集簇6)以及特异的细胞表面标记物(CD74; P < 2.9 × 10−121; 集簇7)为标志。对另外3个未产妇个体数据进行Seurat集簇分析证实了Ind4的图谱(图2)。如同Ind4,其他个体也具有三个主要的细胞集簇,与Basal、L1、L2相对应,以及8-10个亚集簇(SF2a-c)。每个细胞类型中亚集簇的数量在不同个体中是变化的,Ind5个体包含五个集簇:Basal、3个L1以及1个L2;Ind6包含七个集簇:Basal、3个L1以及1个L2;Ind7包含一个Basal、3个L1和5个L2集簇(SF),这可能是由于个体与个体之间的变化或者手术标本的解剖位置。

为了确定个体间的细胞状态,研究者利用细胞划分法开发了一种比较的方法。在Ind4中检测了11个集簇(0–10)中每个标记基因的特征(图2b、c),研究者进行了成对基因得分分析以找到Ind5-7每个不同集簇的匹配(图2a-c)。将Ind4与Ind5-7进行比较发现在所有个体中主要的细胞类型(Basal, L1, L2)都能匹配上(图3a–c)。此外也发现在L1 (L1.1和L1.2)中存在两个不同的细胞状态。L2群体在Ind4中包含两个集簇更加相似,因此这些集簇能够与单个的L2群体相结合。比较个体间的基底亚群,提示至少存在两个细胞状态(图3a-c)。为了进一步探究,研究者进行了Seurat分析,一些集簇能够连续高表达与肌上皮细胞功能相关的基因(e.g., ACTA2, TGLN, KRT14)。基于已经报道的工作研究者建立了“肌上皮细胞特征”的基因表格从而将基底细胞分成基底细胞或者肌上皮细胞。这些结果将所有个别的特定群组包括进五个集簇,命名为基底细胞(B)、肌上皮细胞(Myo)、管腔细胞1.1 (L1.1)、管腔细胞1.2 (L1.2)、管腔细胞2 (L2)以及一些小的非经典的(X)(附录3c),这些称号用于后续四个个体中所有24,465个细胞进行Seurat分析(图3d),进一步确定常见的标记基因(e.g., B: APOD; Myo:TAGLN; L1.1: LTF; L1.2: CLDN4; L2: AGR2) (图3e)。

为了进一步研究这些细胞状态的生物学机制,研究者利用IPA确定了不同的信号通路(SF3d),利用富集工具查找了转录因子的共同位点。这些分析说明Myo的状态可能受转录因子TP63和PPARγ调控,并由升高的整合素和帕西林信号通路定义,提示这些细胞使乳腺上皮构造完整。B状态与转录因子STAT3、SOX2、NANOG、KLF4等与干细胞能力和细胞塑性相关的基因相关联,提示B群体可能具有MaSCs的特性。在管腔细胞中,L1.1表现出iNOS和IL6信号通路不同的特性,提示具有看管这种细胞与组织损伤和炎症相关状态的功能。L1.2表现出PI3K/AKT水平以及糖皮质激素信号的升高,这也提示类固醇激素信号与细胞群体之间的联系。在第二种管腔细胞类型L2中研究者发现上皮细胞中mTOR信号通路以及醛固酮信号通路升高,提示这一细胞类型代表激素响应的细胞群体。

图2基于液滴的scRNA-seq揭示了额外的上皮细胞状态

图3结合基于液滴的RNAseq数据确定了可归纳的细胞类型和状态

细胞类型和状态的空间分析

研究者进一步利用间接的免疫荧光分析在蛋白水平上确定了scRNA-seq的发现,并且在空间上将新发现的细胞类型和状态整合到乳腺构造上。研究者首先聚焦于基底腔室内检测到的细胞状态。研究者将在微粒体scRNA-seq中确定的一组基底细胞ZEB1进行免疫标记(图1d),结果证实蛋白在基底上皮细胞中确实表达(图4a)。高表达的ZEB1和中等水平的KRT14在蛋白C受体(ProCR)表达的小鼠MaSCs细胞中有表现,同时在体内和体外中伴随有干细胞的活性。与伴有ZEB1+的ProtCR+ MaSCs群体相比,在基因表达特征上显著相似(图4b),提示ZEB1+基底细胞代表人类MaSCs细胞。此外,TCF4的免疫标记证实在基底细胞中与ZEB1的印记相似(图4c)。这些结果说明由ZEB1和TCF4表达为特征的细胞特征在完整乳腺的基底细胞中存在。

KRT14的表达是基底细胞的特征,研究者对基因的差异表达分析证实KRT14主要在基底细胞中表达,然而,在Myo高表达细胞状态中的所有细胞群体中表现出多样性(图4d)。KRT14的免疫荧光分析证实KRT14高表达的细胞靠近导管区域的基底细胞层,然而小叶基底细胞中KRT14的印记都或多或少的变化(图4e)。Myo细胞也高表达肌上皮的标记物ACTA2以及其他组织中平滑肌分化和功能相关的基因,如MYLK、MYL9、TAGLN/Transgelin。

惊奇的是,基底和导管的标记物并不专一,研究者发现了一组在管腔细胞(e.g., KRT8)和基底细胞(e.g., KRT14)中特异共表达基因的细胞,这一结果与单细胞表达数据分析是相关的。为了确定这一群体是否在完整组织中存在,研究者通过对KRT8和KRT4的免疫荧光印记进行了共定位实验。在人类乳腺上皮中大多数区域都表现出管腔KRT8+/KRT14−或者基底KRT8−/KRT14+图谱,研究者观察到在组织中有小叶的区域有一些稀少的位点表现出不同的KRT8+/KRT14+图谱。之前在小鼠胎儿MaSCs中观察到这种细胞状态,研究者揭示在人类组织成人内稳态的条件下这一状态存在。

图4 基底细胞状态的描述和空间分析

ScRNA-seq分析揭示管腔细胞具有两个不同的上皮细胞类型(L1, L2)。为了确定L1和L2是否与导管和小叶解剖位置对应,研究者利用特异性的标记物L1 (SLPI) 和L2(ANKRD30A)确定了在乳腺组织中的空间分布。这些分析结果表明L1和L2在导管和小叶中邻近(图5a)。研究者继续探究了它们的激素信号通路的状态。单细胞数据组注释显示L2在ESR1、PGR、AR中显著富集,尽管这些基因表达较低。与这一结果一致的是,研究者在蛋白水平上发现L2的标记物ANKRD30A能够与ER (32.4% of cells)、PR (38.0%)、AR(46.8%)重合,但是在SLPI阳性的细胞中激素受体表达的比例显著降低(图5b-d)。PGR在基底细胞的亚部分中表达,尽管PR在基底细胞的蛋白水平中并未检测到(图5c)。

在成人上皮组织中增殖与活化祖细胞能力相关。有趣的是研究者发现在三个上皮细胞中都观察到了增殖细胞,实验结果经RNA水平以及Ki67免疫印记证实(图5e–f)。此外,CDKN1B (p27)在之前的报道中与激素响应祖细胞群体相关,在L2中发现其表达最高,而囊泡管腔祖细胞功能的标记物,如ELF5和KIT在管腔亚群L1.1中特异性富集。

在L2中KRT8的表达明显高于在L1中(图5g)。为了对个体的蛋白表达进行定量,研究者利用近期发现的单细胞蛋白印迹,该方法能够将每个芯片约2000个细胞的蛋白进行电泳分离,随后用荧光标记的抗体探测。将FACS分离的管腔和基底细胞利用单细胞蛋白印迹确定了三个细胞转态,命名为KRT8-阴性、KRT8-低表达和KRT8-高表达(图5h–i),进一步阐释了单细胞蛋白印迹可作为scRNA-seq下游分析的有效工具。

总之,这些分析确定了scRNA-seq图谱和完整组织中蛋白水平之间显著一致。空间分析证实管腔细胞包含两个不同的细胞类型(L1和L2) 在管道和小叶内混合。两者都包含增殖细胞的亚群,提示它们都包含L1-和L2-定向祖细胞来维持这些细胞类型。基于表达特征,L1定向具有分泌功能,L1更像是发挥乳腺上皮激素感应的装置。

图5 两个不同管腔细胞类型的确定和空间分析

上皮中重塑的种系等级

为了探究这些细胞类型和状态是否彼此相关,研究者进一步通过monocle进行单个细胞的假颞叶有序性重塑了分化的轨迹。四个个体中亚群体的scRNA-seq数据发现一个与分化轨迹密切相关的群体,分为三个与主要细胞类型的分支Basal、L1、L2 (图6a)。这提示该系统通过一个连续的而不是几个间接的种系维持。考虑到越来越多的证据证实在基底细胞中存在MaSCs,研究者在基底细胞中建立了伪时序发现分化成三个主要分支的分化轨迹分别具有Myo、L1、L2富集。显著的是,L1.2在L1和L2之间的分支点显著富集,提示可能代表着管腔受限的双能祖细胞,其在L1分支上也先于L1.1,提示L1.2是L1.1的祖细胞。有趣的是,L1.1高表达ELF5和KIT这两个之前报道祖细胞的标记物。而研究者的数据证实L1.1代表第二成熟、分化的管腔细胞类型,而不是L2上游的管腔祖细胞。这些基础的原则在微流体介导的scRNA-seq数据伪时序分析中均有体现,提出从一个ZEB1祖细胞群体分支成管腔和基底细胞系。这些结果与之前分化/祖细胞双重调节的哺乳动物分化的模型一致。

图6 分化重塑与细胞状态和乳腺癌亚型之间的关系

与乳腺癌亚型对应的亚群

为了了解更多新定义的亚群与乳腺癌亚群之间的关系,研究者利用基因分值的方法直接比较了每个群体的基因特征与Metabric数据库中每个肿瘤亚型。结果发现乳腺癌管腔A和管腔B型与L2型管腔细胞紧密相关,这与之前的报道FACS富集的基底、管腔祖细胞和成熟的管腔细胞的基因特征是一致的。此外,Lehman等人的报道利用全基因分析确定了三阴性乳腺癌分子机制上的不同亚型。研究者发现Myo与TNBC的间质样亚型高度相似,而基底样与管腔L1.1状态的分值最高。总而言之,这些研究将新定义的乳腺癌亚型与不同的上皮细胞群体联系起来,提示这些乳腺癌的亚型可能由不同起源的肿瘤细胞引起。

图7 细胞的异质性与人类乳腺的种系分级

结论

研究者首次大规模探究了乳腺上皮细胞的异质性,单细胞基因特征的无差别分析确定了成人乳腺维持内稳态的分化轨迹,同样定义了基底细胞和管腔下拨的不同亚群可能是乳腺癌不同亚型的起源。研究者乳腺上皮细胞的单细胞图谱是定义乳腺癌过程发生变化的有力资源,因此为癌症早期检测和治疗提供了准则。


更多推荐

高分综述 | Trends in Biotechnology: 单细胞分辨率下利用空间转录组揭示器官分子结构(国人佳作)

重磅综述 | Cell:非编码RNAs在肿瘤学中的作用(IF=36.216)

(0)

相关推荐