Science | 原位基因组测序(IGS)技术,实现对“基因组序列及空间3D结构”同步解析
文章发表在Science上
研究者提出的原位基因组测序(IGS)可以直接在完整的生物样品内进行DNA测序,在内源环境中对全基因组的配对末端序列进行空间定位,从而桥接测序和成像模式以绘制基因组图谱。首先,研究者通过在自然空间环境中扩增基因组的非靶向样本,在固定样本中创建一个原位测序文库;然后,将原位测序与高通量双末端DNA测序相结合,在原位测序后,可进行免疫染色及成像循环,从而确定扩增子的序列和3D位置;最后,将非原位配对末端测序读数与原位扩增子位置进行计算匹配。之后研究者将IGS应用于106个人类成纤维细胞(PGPlf)和113个早期小鼠胚胎中不同发育阶段的细胞,结果显示66.35%的清晰可分辨扩增子与非原位基因组读数相匹配(图1)。
图1. 原位基因组测序方法(IGS),来源:Science
基因组的空间结构在早期胚胎发育中被广泛重塑,鉴于空间特征、序列特异性和细胞间关系在表观遗传重塑等现象中的重要性,研究者将IGS应用于早期小鼠胚胎中不同发育阶段的细胞(PN4受精卵、晚期2-细胞和早期4-细胞),以表征早期胚胎发育中的基因组组织。对相关标志物(着丝粒、核层和核仁前体(NPBs))进行联合免疫染色,直接定位相对于这些标志物的基因组读数以研究标记物的组织作用,根据产量、核型、发育阶段和细胞周期筛选细胞,结果发现非共定位读数在核层和NPBs近端区域显著耗尽。为了确定每个区域的亲本来源,研究者鉴定了任一亲本中与杂合SNP重叠的基因组位置的空间定位读数,1.40%和1.64%的基因组读数分别分配给母本和父本,又通过可视化单倍型信息读数在PN4受精卵中的位置验证了以上分配。胚胎发育阶段,亲本基因组仍然分离在较大的父核和较小的母核中,基于该特征,研究者以半监督方式将每个染色体区域分配给母本或父本基因组,结果显示97.1%的单倍型信息读数与该分配一致(图3)。
接下来,研究者聚焦于前述的全基因组组织原理,重点关注亲本单倍型、着丝粒-端粒位置及GC含量。研究者分析了每个读数的空间染色体间邻居并计算了单倍型空间分离得分,结果显示平均分离得分的标准差随着发育阶段的延长而增加,表明亲本基因组在胚胎内的混合程度是具有异质性的,逐渐混合是有丝分裂后全局染色体重新定位的结果。然后,研究者检查分析了基因组沿着染色体的着丝粒-端粒轴的整体空间结构,结果显示2-细胞和4-细胞阶段的着丝粒显著聚集在细胞核的一侧,并可观察到着丝粒-端粒评分高度极化,通过量化发育阶段的极化,发现2-细胞和4-细胞阶段的相关性比受精卵阶段强,但这两个阶段细胞胚胎中向Rabl样构型转变的功能后果尚不清楚。最后,研究者检查了GC含量在基因组结构中的作用,结果显示GC含量与Chr12跨核层的距离在父本和母本同源物中均存在相关性,且在受精卵中父本同源性显著高于母本同源性,但在2-细胞阶段不存在该现象,这表明GC区室化程度可能受原核的不同生物学历史的影响(图4)。以上结果表明IGS能够以亲本特异性分辨率和核标记来描述不同发育阶段的3D基因组组织。
受精卵原核具有最高的基因组分辨率,其中染色质的大规模亲本特异性重组在ZGA中起着重要作用,因此,研究者使用IGS检测亚染色体的空间结构探究其作用。首先,研究者描述了受精卵亲本基因组中平均空间距离与基因组配对距离之间的比例关系,发现每个亲本基因组都有不同的缩放特性,并且父本受精卵染色质表现出异常弱的A/B区室化和异常大的片层相关结构域。然而,在检查单细胞距离矩阵时,研究者发现单个父本原核通常表现出大量空间上相关的染色质,称其为单细胞结构域(SCDs),鉴定出的SCDs与目测识别出的空间上不同的簇非常吻合,然后,研究者评估了单个细胞中所有SCDs边界的强度,发现它们明显比集成矩阵中用相同方法识别的边界更强,更多变。最后,研究者调查了SCDs与核标记的关系,发现其边界和内部分别明显多于预期的远端板层和近端板层。