Science | 原位基因组测序(IGS)技术,实现对“基因组序列及空间3D结构”同步解析

生物体的基因组在编码基因的同时,在细胞核内也形成特定的三维空间结构,进而调控基因表达并影响细胞功能。因此,绘制高分辨率的空间基因组组织图谱对于理解健康、疾病和发育中的各种调控作用至关重要。当前主要通过基于染色质构象捕获的DNA测序方法(Hi-C)和使用显微镜探测目标基因组位点的方法(如DNA荧光原位杂交(FISH))来揭示基因组结构。
然而,这些方法不能联合应用于同一细胞,并且缺少在单个细胞中同时对基因组进行测序和成像的方法。目前已有一些突破性研究将Hi-C与显微镜相结合或基于单核苷酸多态性(SNP)特异性探针进行FISH检测,但其在成像或测序通量上仍然受到限制。因此,在单个细胞中同时实现基因组分析和空间分析的问题一直悬而未决。
近日,哈佛大学、Broad研究所及MIT联合团队开发了原位基因组测序技术(in situ genome sequencing, IGS),实现了完整生物样品中DNA序列和结构的同时解析;之后将IGS技术应用于人类成纤维细胞和早期小鼠胚胎,在单个细胞核中对数千个基因组位点进行了空间定位,揭示了受精卵中的单细胞染色质结构域及单个胚胎中整体染色体定位的表观遗传记忆。该项工作以“In situ genome sequencing resolves DNA sequence and structure in intact biological samples”为题发表在Science上。

文章发表在Science

研究者提出的原位基因组测序(IGS)可以直接在完整的生物样品内进行DNA测序,在内源环境中对全基因组的配对末端序列进行空间定位,从而桥接测序和成像模式以绘制基因组图谱。首先,研究者通过在自然空间环境中扩增基因组的非靶向样本,在固定样本中创建一个原位测序文库;然后,将原位测序与高通量双末端DNA测序相结合,在原位测序后,可进行免疫染色及成像循环,从而确定扩增子的序列和3D位置;最后,将非原位配对末端测序读数与原位扩增子位置进行计算匹配。之后研究者将IGS应用于106个人类成纤维细胞(PGPlf)和113个早期小鼠胚胎中不同发育阶段的细胞,结果显示66.35%的清晰可分辨扩增子与非原位基因组读数相匹配(图1)。

图1. 原位基因组测序方法(IGS),来源:Science

为了验证IGS方法检测空间基因组组织的特征,研究者首先检查了间期人类男性PGP1成纤维细胞中的染色体位置,再通过计算基因组中成对基因组位置之间的平均空间距离来表征单细胞中二倍体染色体区域的位置。结果显示长度较短的染色体倾向于靠近核中心,这与之前对人类成纤维细胞的研究结论一致,进一步证明IGS能够分辨单细胞细胞核内的二倍体染色体区域并研究染色体的空间定位。接下来研究者应用IGS实现了同时测量基因组中重复序列的定位,并发现某些类型的重复异染色质(如卫星DNA)显示向核中心富集,而其他类型的异染色质在核边缘过度分布,这表明IGS能够以非靶向和全基因组的方式同时识别许多不同重复序列的空间定位模式。最后,研究者通过对空间极化染色体臂进行观察研究,发现IGS可以表征单个染色体的结构。综上所述,这些发现突出了IGS具有同时探究基因组组织广泛特征的能力,包括染色体定位、染色体折叠和重复序列的定位模式(图2)。
图2. IGS表征人类基因组的空间特征,来源:Science

基因组的空间结构在早期胚胎发育中被广泛重塑,鉴于空间特征、序列特异性和细胞间关系在表观遗传重塑等现象中的重要性,研究者将IGS应用于早期小鼠胚胎中不同发育阶段的细胞(PN4受精卵、晚期2-细胞和早期4-细胞),以表征早期胚胎发育中的基因组组织。对相关标志物(着丝粒、核层和核仁前体(NPBs))进行联合免疫染色,直接定位相对于这些标志物的基因组读数以研究标记物的组织作用,根据产量、核型、发育阶段和细胞周期筛选细胞,结果发现非共定位读数在核层和NPBs近端区域显著耗尽。为了确定每个区域的亲本来源,研究者鉴定了任一亲本中与杂合SNP重叠的基因组位置的空间定位读数,1.40%和1.64%的基因组读数分别分配给母本和父本,又通过可视化单倍型信息读数在PN4受精卵中的位置验证了以上分配。胚胎发育阶段,亲本基因组仍然分离在较大的父核和较小的母核中,基于该特征,研究者以半监督方式将每个染色体区域分配给母本或父本基因组,结果显示97.1%的单倍型信息读数与该分配一致(图3)。

图3. 应用IGS对完整的早期小鼠胚胎进行高分辨率的基因组和空间分析,来源:Science

接下来,研究者聚焦于前述的全基因组组织原理,重点关注亲本单倍型、着丝粒-端粒位置及GC含量。研究者分析了每个读数的空间染色体间邻居并计算了单倍型空间分离得分,结果显示平均分离得分的标准差随着发育阶段的延长而增加,表明亲本基因组在胚胎内的混合程度是具有异质性的,逐渐混合是有丝分裂后全局染色体重新定位的结果。然后,研究者检查分析了基因组沿着染色体的着丝粒-端粒轴的整体空间结构,结果显示2-细胞和4-细胞阶段的着丝粒显著聚集在细胞核的一侧,并可观察到着丝粒-端粒评分高度极化,通过量化发育阶段的极化,发现2-细胞和4-细胞阶段的相关性比受精卵阶段强,但这两个阶段细胞胚胎中向Rabl样构型转变的功能后果尚不清楚。最后,研究者检查了GC含量在基因组结构中的作用,结果显示GC含量与Chr12跨核层的距离在父本和母本同源物中均存在相关性,且在受精卵中父本同源性显著高于母本同源性,但在2-细胞阶段不存在该现象,这表明GC区室化程度可能受原核的不同生物学历史的影响(图4)。以上结果表明IGS能够以亲本特异性分辨率和核标记来描述不同发育阶段的3D基因组组织。

图4. IGS表征胚胎基因组组织的发育转变,来源:Science

受精卵原核具有最高的基因组分辨率,其中染色质的大规模亲本特异性重组在ZGA中起着重要作用,因此,研究者使用IGS检测亚染色体的空间结构探究其作用。首先,研究者描述了受精卵亲本基因组中平均空间距离与基因组配对距离之间的比例关系,发现每个亲本基因组都有不同的缩放特性,并且父本受精卵染色质表现出异常弱的A/B区室化和异常大的片层相关结构域。然而,在检查单细胞距离矩阵时,研究者发现单个父本原核通常表现出大量空间上相关的染色质,称其为单细胞结构域(SCDs),鉴定出的SCDs与目测识别出的空间上不同的簇非常吻合,然后,研究者评估了单个细胞中所有SCDs边界的强度,发现它们明显比集成矩阵中用相同方法识别的边界更强,更多变。最后,研究者调查了SCDs与核标记的关系,发现其边界和内部分别明显多于预期的远端板层和近端板层。

图5. IGS揭示受精卵中的单细胞结构域,来源:Science
(0)

相关推荐