scATAC-seq2: scATAC-seq技术原理
引文
之前的推文中,我们主要对scATAC-seq研究的科学问题作了简单的介绍。这篇推文主要介绍scATAC-seq的技术原理和发展历程。下面这张图选自SnapATAC这个R包的作者Rongxin Fang的github上分享的内容(https://github.com/r3fang/SnapATAC/blob/master/notebooks/experiemnt_timeline.md),记录了从2015年到2019年期间scATAC-seq技术的发展。早期的scATAC-seq测序通量很低,而现在的scATAC-seq (常用的是10x) 能够达到很高的通量。
早期scATAC-seq技术
scATAC-seq的技术原理最早见于2015的Shendure实验室在《Science》发表的文章《Multiplex single-cell profiling of chromatin accessibility by combinatorial cellular indexing》和Greenleaf实验室在《Nature》发表的文章《Single-cell chromatin accessibility reveals principles of regulatory variation》。其在技术原理上的差异见下图。
这两项技术的差异主要体现在获取单细胞的方式上。Shendure实验室提出的技术方法采用了两步的细胞索引策略(左图):裂解细胞后,约2500个细胞核进入96孔板,然后含有特殊接头的转座酶分别加入每个孔板当中,因此每个孔板中的细胞池都对应一个特定的barcode;接着混合每个孔板中的细胞核,通过流式细胞仪分选后的细胞核进入第二个96孔板;在第二个96孔板上的细胞核被裂解成DNA,并将含有第二个barcode的引物对DNA进行扩增。这个方法的基础在于分离后90%的两个barcode的组合信息能对应到单个细胞上,但其主要缺陷在于每个细胞得到的reads的平均数目低于3000。Greenleaf实验室发表的技术主要是通过物理方法对细胞进行分离,基于纳米级的反应槽对其进行ATAC-seq,但是每个反应槽都需要通过显微镜进行核验,确保获取的是单个细胞。这种方法下,每个细胞得到的reads数目约为73000。从这两项技术的特点来看,早期获取单细胞ATAC的技术方法相对是比较粗糙的,获得的细胞数量也较少。
10x scATAC-seq
2018年,10x Genomics推出的scATAC-seq的技术方法成为现在最常用的scATAC-seq测序技术,其与10x的scRNA-seq技术都是通过凝胶微珠的方法对细胞进行包裹。下面这张图主要介绍了10x scATAC-seq的建库方法。
与10x scRNA-seq的建库方法不同的是,scATAC-seq的凝胶微珠没有UMI的相关标签,这是因为scRNA-seq需要通过UMI标签区分同一细胞的不同转录本,而scATAC-seq是对细胞核中DNA的片段进行ATAC-seq测序。另外一点,scRNA-seq只能对含有Poly(A)尾的RNA片段进行测序,并需要将片段打断,便于illumina测序;而scATAC-seq能够对细胞核中所有的DNA进行测序,并且不需要将DNA片段打断。
Spatial-ATAC-seq
与RNA-seq的技术发展路线很相似,ATAC-seq技术的发展也呈现着由组织水平到单细胞水平最终达到空间水平的发展趋势。2021年樊荣老师课题组在bioRxiv预印本上发布了空间ATAC-seq的技术方法,实现了在空间水平解析细胞的染色质开放性。这篇文章通过对小鼠胚胎发育的多个阶段的Spatial-ATAC-seq分析,提供了小鼠胚胎发育的空间表观图谱。
总结
当前scATAC-seq技术仍然处于发展中的阶段,尤其是空间表观组还处于萌芽阶段。与bulk ATAC-seq相比,scATAC-seq对于开放染色质区域的捕获能力仍然是不足的,另外在scATAC-seq的细胞类型定义当中,往往需要借助scRNA-seq的数据进行辅助,也是scATAC-seq分析中的一个难点。接下来,我们将介绍scATAC-seq的常用分析方法。