科研 | 美国俄勒冈大学Adam C. Miller等:用于斑马鱼发育的单细胞转录组图谱
编译:不二,编辑:十九、江舜尧。
原创微文,欢迎转发转载。
论文ID
原名:A single-cell transcriptome atlas for zebrafish development
译名:用于斑马鱼发育的单细胞转录组图谱
期刊:Developmental Biology
IF:2.936
发表时间:2019.11
通讯作者:Adam C. Miller
通讯作者单位:美国俄勒冈大学神经科学研究所
DOI号:10.1016/j.ydbio.2019.11.008
实验设计
胚胎细胞解离:使用Collagenase P裂解缓冲液和胰蛋白酶等分离单细胞。样品经过匀质,洗涤,过滤,离心,制成细胞悬液。
单细胞测序:制备10X Chromium文库,使用Illumina Hi-Seq 及Next-seq平台测序。
数据分析:测序数据经过质量过滤后,使用Cellranger(v2.2.0)软件比对到斑马鱼参考基因组(GRCz11_93)上,使用R语言Seurat(v3.4.4)进行基因表达的分析。
伪时间分析:使用Monocle软件,以默认的参数对视网膜祖细胞、视网膜神经元细胞和感光细胞进行假时间轨迹分析。
细胞簇的注释:利用尤其是斑马鱼信息网络(ZFIN)等公共数据库的RNA原位表达数据,将细胞簇中最相似的细胞类型与相应的组织对应。
结果
器官发生过程中的斑马鱼scRNA-seq图谱
研究者将转录组图谱作为研究动物发育过程中特异细胞命运相关的基因表达变化的工具,为脊椎动物器官发生提供新的见解。为了生成高质量的单细胞转录谱,利用独立的交配、文库制备以及每个发育阶段的测序,对细胞解离和scRNA-seq方法的可重复性进行了研究,包括受精后第1、2和5天(dpf)。这些数据包含44012个细胞,每个细胞拥有74914个平均读数,每个细胞基因的中位数为1807个,每个细胞唯一转录分子的中位数为8345个。研究者使用Seurat软件将转录相似的细胞聚类在一起,并根据聚类多样性和所有聚类中每个细胞重复的标记基因,将实验重复的结果相互比较。结果发现,在每个发育阶段和每个独立的实验都有助于计算鉴定细胞簇,这表明作者的解离方法在所有的细胞类型上均可实现可重复性。因此,该方法支持大量且可重复的单细胞转录组学分析和聚类,能够研究器官发生过程中的细胞类型、状态和发育转变。
转录组图谱内细胞簇的细胞类型注释和de novo基因识别
斑马鱼scRNA-seq图谱可以提供多个发育阶段的细胞类型准确的基因表达谱。作者汇总了来自三个不同发育阶段(1、2和5dpf)的所有六个实验的结果,鉴定了发育过程中细胞类型的多样性(图1A)。共鉴定出220个细胞簇,针对每个细胞簇,研究者试图将其与最可能的细胞类型相对应。
为了注释每个细胞簇,使用了明确的及已报道的标记基因,这些基因来源于斑马鱼信息网络(ZFIN)。例如,与肝细胞相关的基因fabp10a和cp在整个数据集中表达差异最大,并且在细胞簇主成分分析(PCA)中,它们富集在第一主成分(PC)中。作者在图谱中展现了这些基因的表达,并确定了两个紧密相邻的细胞簇,它们还表达了肝脏发育和功能相关的其他转录本(图1B)。这些细胞簇中鉴定的前30个表达差异最大的基因,发现有15个在ZFIN的肝细胞中表达(图1B),说明研究者对细胞簇的注释是正确的。此外,发现7个基因的表达特征很差,其中包括si:dkey-96f10.1(图1B),它们在两个肝细胞簇中表达,彰显了单细胞转录组图谱为序列已知的基因提供信息的能力。分析还揭示了这两个肝细胞簇之间其他差异表达的基因,包括细胞簇55中的hmgcra、fads2和msmo1,细胞簇121中的crp2和BX001030.1(图1B)。这两个肝细胞簇之间基因表达的差异不太可能是发育阶段特异性的,因为这些细胞簇的所有细胞均来自5dpf胚胎。
接下来,探究了这些实验是否捕获了稀有细胞类型。每个斑马鱼的胚胎从1dpf到5dpf只有大约30个原始生殖细胞(PGC),这为检测稀有细胞类型提供了有效的测试案例。发现一个细胞簇(细胞簇219)表达了PGC标记基因ddx4、nanos3、dnd1和piwi2,表明PGC在转录组图谱中进行了测序和聚类(图1C)。PGC的恢复表明,本研究对发育阶段中存在的大多数细胞类型进行了分析,并提供了检测稀有细胞类型阈值下限的估计值。该发现不排除由于缺乏解离、细胞死亡或样本量不足而无法检测到某些细胞类型的可能性。
最后,对图谱中的所有220个细胞簇进行注释。首先确定了每个细胞簇中表达差异最大的前16个基因,因为每个细胞簇相对于图谱中的所有其他细胞而言,它们在细胞之间的表达比例最高。使用公共数据库中的RNA原位表达数据,作者为每个细胞簇注释了最可能的细胞类型和相应的组织(图1A)。这些注释以嵌套的模式展现,其中包含有关胚层、组织类型以及最终细胞类型的信息。在每个细胞簇中,前16个表达差异最大的基因中包含了ZFIN中拥有清晰表达模式的标记基因,以及没有任何表达模式信息的标记基因。对于大多数细胞簇(169/220),以前表达信息很少或没有表达信息的基因(例如ZFIN中以“si:”或“zgc:”开头的基因)出现在前16个表达差异最大的基因中,所有细胞簇中平均有两个(mean=2.2,range=0-9,SD=2.1)。例如,在肝脏、脊索和视网膜中,基因si-dkey-96f10.1、si-ch1073-45j12.1和si-dkey-16p21.8分别在不同器官中差异表达,并可能代表这些器官的标记基因。因此,标记基因的表达与体内RNA表达模式分析相结合,是一种注释转录组图谱中离散细胞簇有效的手段。
图1 器官发生过程中发育的斑马鱼胚胎的scRNA-seq图谱。
基因表达的组合分析识别细胞空间位置和身份
如果可以提供空间信息,转录组数据的细胞类型图谱将更加完善。这是整个斑马鱼scRNA-seq数据的主要挑战,因为测序细胞的解剖位置在细胞解离后都会丢失。对于某些细胞表达谱是不同的,例如肝细胞,它们在动物体内的解剖位置特定的,从而使其鉴定相对简单。但是,包括神经系统在内的许多组织具有惊人的功能和细胞多样性,由于许多细胞类型在转录上相似,但在解剖学上占据不同的位置,因此面临着特殊的挑战。例如,兴奋性和抑制性神经元遍布整个神经系统,并且区分这两种细胞类型的神经递质和囊泡转运蛋白在转录组图谱中的许多离散神经元细胞簇中广泛表达,类似于在老鼠神经系统中发现的那样。作者研究了空间受限的基因表达区域是否会提供有关神经细胞亚型的信息。
利用与神经系统相对应的细胞簇(图2A),研究者发现了与神经干细胞、细胞分化、有丝分裂后神经元和成熟神经元相关的基因表达谱(图2B)。在图谱的亚细胞簇中,检测了已知沿中枢神经系统A/P轴在空间上表达受限的基因,并发现这些细胞簇UMAP空间的排布方式类似于体内的A/P轴(图2C–E)。众所周知,神经系统整合了A/P和D/V轴的信息以产生特定的细胞命运。研究最深入的例子之一是脊髓运动神经元,其中神经管内的pMN腹部祖细胞接收高水平的Shh信号,从而激活了诸如hoxa9a、olig2、isl1、isl2a和mnx1等转录因子。为了识别脊髓运动神经元,首先使用仅限于脊髓后部表达的hoxa9a(图2E)、hoxb9a、hoxc8a、hoxb8a和hoxc6b,来区分脊髓神经细胞。接下来,检测了来自D/V轴的位置信息产生的pMN标记基因,发现它们在神经系统的特定区域高表达(图2F)。令人惊讶的是,只有一个神经细胞簇映射到A/P和D/V轴标记基因的交点(图2A,F,G),并且该细胞簇表达诸如乙酰胆碱神经递质转运蛋白slc18a3a、运动神经元标记基因mnx1和神经元分化标记基因snap25a。这些结果表明,空间受限的转录因子与决定运动神经元的分子的组合分析,可以识别图谱中神经元的解剖和功能不同的细胞种群。该方法应用于图谱的所有中枢神经系统细胞簇,并有助于分析解剖和功能不同神经元之间的空间基因转录差异。总之,即使只有复杂且相似的转录谱,受空间限制表达的基因也可以定位到单细胞转录组图谱中,增强了对这些区域内细胞类型特异性基因表达的了解。
图2单细胞转录组图谱中受空间限制的基因表达模式。
单细胞转录组图谱中细胞类型特异性基因表达随时间的变化
该图谱的主要目标是提供有关斑马鱼发育四天中基因表达变化的时间信息。该方法对于理解干细胞和祖细胞如何产生多样化后代的遗传基础,以及分化的细胞在器官发生过程中成熟到形成有功能的组织的信号通路至关重要。
通过汇总三个发育阶段的重复实验,鉴定了在此发育阶段过程中与特异细胞类型和器官发生有关基因的表达变化。在图谱的转录空间作图中,细胞簇通常根据发育时间而分开(图3A)。尽管整个图谱的主要因素是起源时间,但在每个特定的转录识别细胞类型中,都有明显的转录连续性实例连接着发育时间点。
例如,脊索在不同发育时间形成了几个离散的细胞簇(图3B和C)。基于tbxta独特的表达以及col2a1a、col9a2和matn4的表达鉴定了脊索细胞。因此,研究发现UMAP转录空间将脊索细胞有效地聚集在一起,并且还保留了与发育时间相关的转录差异。
鉴定了不同发育时间脊索细胞簇表达差异的基因。发现col5a3a、prx和etv4在1dpf脊索细胞中表达丰富;si-ch1073-45j12.1在2dpf脊索细胞中表达,但在5dpf时下降;scube2、pvalvb1和gas2b则在2–5dpf脊索细胞中特异性表达(图3D)。重要的是,鉴定了整个发育阶段的脊索中表达的基因(在两个脊索细胞簇中都相同),包括col9a1b、col11a2和shha(图3D)。挖掘这些数据并进行功能验证实验,可以了解脊索分化的机制。总之,通过比较来自不同发育时间相同组织的细胞转录谱,可以有效地捕获转录组图谱中的基因表达随时间的变化。
接下来,分析了相关细胞类型中整个发育时期的特异细胞类型的转录轨迹。一个明显的例子出现在神经嵴细胞谱系中(图3E和F)。使用crestin、ednrab和sox10鉴定了与神经嵴祖细胞相对应的细胞簇(图3G)。神经嵴细胞的神经后代的特征是ngfrb、zwi和elavl3的表达,黑色素细胞是slc24a5和tyr的表达,黄色素细胞是cax1、plin6和aox5的表达(图3G–J)。具有这些独特的神经嵴细胞转录谱在UMAP中接近神经嵴祖细胞,并按照发育阶段的连续排列(图3E和F)。
有趣的是,一个研究不多的基因zgc:91968在黑色素细胞簇中表现出高水平的表达(图3I),si:dkey-25li10.2和si:dkey-129g1.9在黄色素细胞簇中表现出高水平的表达,扩展了对这些转录本的细胞类型特异性表达模式的了解。因此,该图谱是研究祖细胞分化为多种细胞类型基因表达变化的有效工具。
图3 单细胞转录组图谱中随时间变化的基因表达分析。
使用Monocle的伪时间分析改善了发育过程中的时间基因表达分析
为了验证不同发育阶段相似类型细胞鉴定的基因表达变化,研究了发育视网膜细胞谱系(图4A和B)。根据cx43的表达鉴定出视网膜色素上皮细胞簇(图4C);根据vsx2和col15a1b的表达鉴定出视网膜祖细胞(图4D);根据crx和Neurod1的表达鉴定出分化的视网膜细胞,并且发现otx2b、foxn4、hes2.2和ntoh7的差异表达(图4E);根据lin7a的表达鉴定出视网膜神经元细胞,并且发现alcama和barhl2的差异表达(图4F);根据rho的表达鉴定出感光细胞,并且发现grk1a和opn1lw2的差异表达(图4G)。有趣的是,这些细胞类型在UMAP中的邻近表明,它们的转录组以连续方式相关(图4A),类似于脊索和神经嵴细胞谱系。此外,年轻的细胞(1dpf)在视网膜祖细胞簇中大量富集,而感光细胞和视网膜神经元细胞簇则主要富集在较老的细胞(5dpf)中(图4A和B)。在这些祖细胞和分化的细胞之间,作者发现了主要来自2dpf胚胎的细胞(图4B)。尽管在UMAP中从年轻细胞到较老细胞都有总体分布,但还发现了视网膜祖细胞簇中有2dpf和5dpf幼虫的细胞,以及分化的视网膜细胞簇中有5dpf的细胞(图4A和B)。随着视网膜细胞在整个生命周期中的持续发育,在本实验中检测到其随时间有大量的增殖和分化发生。
将基于已知年龄的关系与整个视网膜细胞谱系中基因表达变化的无监督伪时间分析进行比较。从Monocle分析中去除了与视网膜色素上皮相关的细胞簇,因为这些细胞与视网膜神经元无关而是从视网膜祖细胞分化来的。使用Monocle进行的分析揭示了许多与视网膜发育有关的de novo基因,从而推动了对与不同发育阶段相关的基因表达变化的研究。令人惊讶的是,伪时间分析与视网膜细胞谱系中每种细胞类型的发育阶段密切相关(图4H)。具体来说,Monocle描述了视网膜细胞的伪时间顺序,使注释结果更加可靠,并与它们的发育阶段一致(将图4H与图4A和B进行比较)。结果表明基因表达的时间变化以连续的方式发生,从祖细胞到分化的感光细胞和视网膜神经元细胞。这种伪时间分析有助于鉴定在视网膜分化期间下调的基因,例如sox2,以及在视网膜分化期间上调的基因,例如crx、olig2和rho(图4J)。Monocle分析鉴定了在整个视网膜分化过程中发生的受时间限制表达的其他基因,为了解发育过程中与视网膜祖细胞和感光细胞特异性表达的基因提供了丰富的资源(图4K)。这些结果强调了单细胞转录组图谱在研究斑马鱼发育过程中基因表达的时间变化方面的有效性。
图4 视网膜的时间和伪时间的基因表达分析。
讨论
斑马鱼器官发生单细胞转录组图谱是研究人员研究基因表达、发育轨迹及鉴定发育中的斑马鱼细胞类型的工具。研究者对受精后1到5天的44102个细胞进行了测序分析,提供了有关脊椎动物中所有主要器官形成过程中的基因表达变化。注释了所有220个经过生物信息学鉴定的细胞簇,并重点介绍了几种以单细胞分辨率寻找斑马鱼胚胎发育相关的基因表达变化的策略。研究证明:1)可以使用标记基因表达来注释细胞簇;2)基因表达分析可以提高对以前仅序列已知基因的了解;3)时间基因表达变化可以追踪分化过程中特定细胞类型基因表达模式的连续变化。
本研究提供的转录组图谱仍需要进行额外的研究,以提高器官发生图谱的准确性和实用性。具体而言,在细胞类型特异性基因表达方面具有深厚专业知识的研究人员可以改进细胞簇的注释,可以改进此初始版本,对于假设检验更加有用。作者在此网站上(http://www.adammillerlab.com)提供了原始数据、分析方法和细胞簇鉴定的方案,以及改善转录组图谱实用性的工作进展和反馈。从根本上讲,作者将转录组图谱中的基因表达分析视为一种假设生成过程,需要后续的功能实验验证其准确性。例如,本研究提出的斑马鱼肝细胞多样性可以联想到哺乳动物中最近的研究工作。此外,在一个肝细胞簇(细胞簇55)中代谢酶(hmgcra,fads2和msmo1)的差异表达和在另一个肝细胞中与免疫相关的促炎性基因表达(crp和crp2)的差异表达,表明发育中的斑马鱼功能不同的细胞亚型参与该组织所需的免疫和代谢过程。当然仍需要RNA原位杂交和基因功能失活实验分析,来鉴定其在发育过程和体内稳态中的功能。为了方便访问本研究中已处理的数据,作者将这些数据储存在UCSC Cell Browser(http://zebrafish-dev.cells.ucsc.edu)中。
评论
本研究提供的数据为斑马鱼领域中正在进行的广泛研究工作提供了帮助,作者使用scRNA-seq分析了斑马鱼胚胎发育早期阶段的基因表达变化。越来越多的细胞类型的转录组数据以及数据分析工具,可用于系统地理解动物发育的分子和遗传基础。正在进行的研究工作将扩展此转录组图谱,并将数据与其他研究人员的数据整合成包括成年组织的斑马鱼发育图谱,继续通过UCSC Cell Browser和ZFIN等公共数据库展现这些数据。有望生成的数据将有助于全面研究斑马鱼细胞转录组图谱。
更多推荐
1 科研 | 基于转录组和调控网络分析揭示了石斛降血糖作用及其机制(国人二区作品)