科研 | NAT PLANTS:地钱草的TCP转录因子活性与三维染色质结构相关(国人佳作)
编译:秦时明月,编辑:景行、江舜尧。
原创微文,欢迎转发转载。
基因组中的信息不仅编码在序列或表观遗传修饰中,还可以在基因的三维空间折叠中找到。相互作用的基因组区域被称为拓扑相关结构域(TADs),其被认为是超越核小体水平的基因组组织的关键特征。然而,现阶段对TADs在植物中的形成和功能的了解是极其有限的。在本研究中,研究人员发现陆生植物谱系中的多态地钱草的基因组显示出与高等植物相似的表观遗传特征的TADs。通过分析地钱草 TADs的各种表观遗传标记,研究人员发现这些区域通常代表间质异染色质,它们的边界富含地钱草转录因子TCP1。研究人员还鉴定了一种类型的TAD,研究人员将其命名为“富含TCP1的TAD”,其基因组区域高度可读,并与TCP1蛋白紧密结合。TCP1靶基因的转录随基础基因位置的不同而不同,富含TCP1的TADs的转录水平明显较低。在tcp1突变系中,TCP1结合的TAD和富含TCP1的TADs都没有显示出明显改变的染色质组织模式,这表明在地钱草中,TCP1对于TAD的形成是必不可少的。然而,研究人员发现在tcp1突变体中,与不属于这些TADs的基因相比,位于富含TCP1的TADs中的基因具有更大的表达倍数变化。本研究结果表明,植物TADs除了作为空间染色质堆积模块外,还具有与转录因子活性相关的微核的功能。
论文ID
原名:Marchantia TCP transcription factor activity correlates with three-dimensional chromatin structure
译名:地钱草的TCP转录因子活性与三维染色质结构相关
期刊:Nature Plants
IF:13.256
发表时间:2020年9月
通讯作者:刘昶
通讯作者单位:德国图宾根大学植物分子生物学中心
DOI号:10.1038/ s41477-020-00766-0
实验设计
结果
研究人员从两个生物学重复中生成了地钱草的高分辨率Hi-C图谱。在最近的一项研究中,研究人员发现在染色体水平上,地钱属的性别和常染色体在线性基因组结构、表观基因组图谱和三维染色体组织方面具有显著的特征。因此,这项工作中的所有分析都集中在常染色体上。研究人员发现相当一部分地钱草基因组清楚地显示了TADs (图1A)。通过对所有常染色体的肉眼观察表明,地钱草 TADs并不是直接相邻的,这是动物TADs 的一个特征。相反,与高等植物相似,TAD结构之间也有非TAD区域。研究人员应用了先前建立的“箭头”方法来扫描Hi-C图,并注释了4013个TAD。它们散布在所有的染色体上,共同覆盖了基因组的40%。通过检查这些TADs的线性基因组和表观基因组特征,研究人员发现它们与其邻近的染色质区域明显不同。一般来说,异色和等色标记分别在TADs的内部和侧翼区域高度富集(图1B)。地钱草 TADs和TAD边界染色质状态的这些特征与许多其他植物基因组中注释的TADs相似,研究人员也可以检测到与拟南芥中的“TAD内部类似”和“TAD边界类似”区域的相似性。此外,地钱草 TADs缺乏基因;而它们的边界优先与基因的转录起始位点(TSS)或转录终止位点(TTS)重叠(图1C,D)。因此,TAD小体富含各种类型的重复序列,并显示出高度的DNA甲基化(图1E)。综上所述,地钱草 TADs主要是散布在染色体上的异染色质和/或较长的基因间隔区,它们在细胞核内以自组织结构模块的形式出现。
尽管从它们的平均分布来看,它们是异质的,但地钱草 TADs并不是一个同质的种群。通过观察单个TAD中的平均甲基化比率,研究人员发现它们至少可以分为两类,其中成员始终高度甲基化(MCG比率≈0.8)或无甲基化(MCG比率≈0)(图1F)。为了更深入地了解TADs的这些亚类,研究人员随意将它们注释为“MCG-poor”(MCG比率低于0.2)、“MCG-rich”(MCG比率高于0.6)和“MCG-Medium”(MCG比率在0.2和0.6之间)(图1F)。正如预期的那样,除了被等色标记外,富含MCG的TADs还被密集的异染色质标记(例如,H3K9me1和H3K27me1)。通过计算相互作用衰减指数,描述染色质相互作用强度随着基因组距离的增加而下降的速度,研究人员发现富含MCG的异染色质TADs比其他两种类型的染色质组织更密集(图1G)。有趣的是,MCG贫乏的TADs显示出活性表观遗传标记的适度耗尽和H3K27me3的富集,这表明它们在转录方面总体上不是高度活跃的。与全基因组基因表达谱相比,位于富含MCG的TADs中的基因表现出较低的表达水平。值得注意的是,富含MCG和缺乏MCG的TADs在其边界都显示了可接近的染色质的富集,这意味着地钱草 TAD边界的形成与边界区域和未知的染色质相互作用因子之间的相互作用有关。由于地钱草 TADs不是同源的,研究人员根据最近公布的描述各种地钱草组蛋白标记的数据集对它们进行分类。使用这种方法,研究人员将TADs分为8个簇,其中簇4(富含H3K9ac和H2A.Z)和簇5、6(富含H3K9me1和H3K27me1)总共包括超过60%的注释TAD(图1H)。这三个簇占DNA甲基化水平注释的TAD组的大部分。综上所述,地钱草 TADs是具有不同表观遗传学特征的单个染色质区域的混合群体。
接下来,研究人员研究了TAD布局是否与基因共表达有关,因为如果一个基因对位于促进启动子接触的同一个TAD中,预计会发现更频繁的基因协同调节。在这方面,研究人员通过整合不同发育阶段的不同地钱草组织的转录组数据来产生共表达矩阵。由于物理连锁和顺式元件的共享,在线性基因组中相互毗邻的基因(分隔不到5千Kb)显示出较高水平的正相关表达。除此之外,研究人员发现TADs含有比预期更多的共表达基因对,这表明地钱草 TAD的划分是共表达网络机制的一部分。
图1. 地钱草常染色体的相关染色质结构域。A 2号染色体600kb区域的Hi-C图谱快照。B 平均表观遗传特征在地钱草TADs上的分布。C TADs周围的蛋白质编码基因注释。D、TSS和TTS在TAD边界附近的分布。E CG、CHG和CHH甲基化在TADs中的分布。F TADs群体CG DNA甲基化水平分布。G 用相互作用衰减指数比较不同类型TADs的染色质致密性。H 根据表观遗传聚类(根据组蛋白标记)和DNA甲基化对TADs进行分类。
2 TCP1蛋白在许多TAD边界富集,但对于TAD的形成是不必要的
在动物中,CTCF绝缘蛋白与粘附素一起,通过与TAD边界的染色质相互作用,促进TAD的形成。以前,研究人员发现水稻基因组中的TAD边界富含植物特异性I类TCP转录因子识别的基序。地钱草基因组编码两个TCP基因TCP1和TCP2,分别属于I类和II类分支。由于每个地钱草 TCP与同一支系中的原始成员相比有一个高度保守的DNA结合域,研究人员预计它们应该能识别在高等植物中发现的已知共识DNA序列。因此,假设植物TCP蛋白参与TAD边界的形成,研究人员检查了TCP结合基序是如何跨越地钱草 TAD边界分布的。基序相似性度量分析表明,TCP1识别的序列在TAD边界区域明显富集;而TCP2识别的序列略有富集。此外,表达分析表明TCP1在菌体中组成性转录,而TCP2不能被检测到。这些数据表明TCP1是TADs的潜在调节因子,这促使研究人员合成TCP1抗体来进行Chip-Seq实验,以检测体内TCP1-染色质的相互作用。
TCP1与地钱草基因组有广泛的相互作用。总共,在常染色体中大约有11,600个区域被鉴定为TCP1峰,它们总共覆盖了大约11.8Mb(~5%)的基因组。与TCP1结合的染色质被H2A.Z高度富集,但异染色质减少,表明该转录因子不与异染色质相互作用。研究人员进行了从头测序分析,以揭示富集在TCP1峰中的基序。正如预期的那样,在所有确定的基序中,与高等植物中I类TCP蛋白识别的典型序列基序相似的一个序列在TCP1峰区的中心显示出最强劲的富集。通过检查TADs处的TCP1峰分布,研究人员发现TCP1在TAD边界处富集(图2A)。在所有4013个已鉴定的TADs 中,1164个(29%)TCP1峰在附近(1kb以内)与其重叠;499个(12%)TCP1具有与TCP1相关的两个边界。此外,与TAD边界相关的TCP1 Chip-Seq峰比预期的多(图2B)。这些观察表明,地钱草 TADs和TCP1的边界有明显的重叠。对于单个基因,TCP1可以与高表达和低表达的基因相互作用,暗示TCP1和基因表达之间的复杂关联(图2C)。有趣的是,对于中度到高表达的TCP1靶基因,TCP1主要与它们的TSS和/或TTS结合;而对于那些低表达或沉默的基因,TCP1往往通过它们的基因体相互作用(图2C),这意味着TCP1的转录调控方式不同。
接下来,研究人员使用CRISPR-Cas9基因编辑来评估TCP1缺失对TAD结构的影响。与最近的一项研究一致,研究人员的tcp1基因敲除突变体显示出生长速度降低,并逐渐发育成卷曲的叶状体。所有这些生长缺陷都可以用包含TCP1位点的6.8kb基因组片段完全回补。接下来,为了评估TCP1在3D基因组组织中的潜在作用,研究人员从Tak-1植物中产生了对应于两个独立的tcp1株系的两个Hi-C数据集和另一个Hi-C数据集。在染色体尺度上,tcp1突变体Hi-C图谱显示出与野生型植物高度相似的A/B区段模式,表明基因组组织没有显著变化。关于局部染色质的相互作用,研究人员检查了tcp1 Hi-C图谱是否显示TADs的变化,其中TCP1与其边界相关。然而,两个独立的tcp1突变系的Hi-C图谱并没有发现它们的TAD模式有明显的变化(图2D)。对其进行的定量比较表明,TCP1的丢失不会导致这些TAD边界发生系统变化(图2E)。然而,将TCP1结合的TAD边界的变化与不结合TCP1的TAD边界的变化进行比较时,发现了统计上的细微差别。然而,对TCP1结合的TAD边界周围的染色质模式的检查没有发现突变体中有任何明显的变化。研究人员推测,TCP1结合基因在TAD边界的转录变化导致了Hi-C图谱上的细微差异,因为基因转录状态本身被证明是Hi-C模式的有力预测因子。总体而言,两个tcp1突变体株系在TCP1结合的TAD边界上都没有表现出剧烈的变化,这意味着TCP1对于地钱草中的TAD结构不是必不可少的。
3 一些MCG缺乏的TAD小体与TCP1有强烈的相互作用
对TCP1 Chip-Seq峰和Hi-C图的研究显示了一种密集的TCP1-染色质相互作用的TAD(图3A)。在地钱草基因组中,这种类型的TAD,与TCP1 Chip-Seq峰显示出相当大的重叠,发生的频率比偶然的要高(图3B)。为了进一步描述这些TADs,研究人员随意地将TCP1峰覆盖了至少20%的TAD区域的TADs命名为“富含TCP1”的TADs。总共确定了456个富含TCP1的TADs。值得注意的是,根据DNA甲基化,富含TCP1的TADs几乎完全属于MCG贫乏的TAD类别,或者根据组蛋白标记属于“簇4”(图3C,D)。与其他TAD相比,簇4中的成员在TAD小体上具有更高的H3K9ac和H2A.Z水平。接下来,研究人员使用TCP1的免疫染色结合FISH(荧光原位杂交)来检测TCP1蛋白和富含TCP1的TADs的空间定位。在细胞核中,TCP1蛋白并不均匀分布在核质中,而是表现出斑点状(图4A,B)。此外,研究人员观察到富含TCP1的TADs定位于TCP1蛋白斑点中(图4C-F)。与MCG贫乏的TAD类别中的其他成员相比,富含TCP1的TADs具有不同的表观遗传方式,但染色质可及性和其他基因组特征相似。富含TCP1的TADs缺乏活性常染色质标记,包括H3K4me1、H3K4me3和H3K36me3;然而,它们也缺乏H3K27me3,这是沉默蛋白编码基因的标志。这些模式表明,与其他TADs相比,富含TCP1的TADs定义了一种具有不同转录调控机制的染色质结构域。
大约22.6%的TCP1靶区位于富含TCP1的TADs内(图5A)。通过检查富含TCP1的TADs上的TCP1 Chip-Seq数据,研究人员发现这些TAD边界上TCP-染色质相互作用强度的急剧转变(图5B),这意味着TCP1-染色质相互作用和富含TCP1的TADs的建立之间可能存在反馈。位于富含TCP1的TADs内部的TCP1-染色质相互作用似乎不同于外部的TCP1-染色质相互作用。在所有已鉴定的TCP1 Chip-Seq峰中,那些位于富含TCP1的TADs中的峰要宽得多,它们之间的距离也较小(图5C,D),这表明富含TCP1的TADs定义了染色质结构域,具有增强的TCP1-染色质相互作用。在这两个tcp1基因敲除系中,研究人员发现富含TCP1的TADs系统性地向较低的值移动;作为对照,在属于MCG贫乏TADs类别的“无TCP”TADs中没有观察到这样的变化(图5E)。然而,tcp1的这一统计显著变化并未显示富含TCP1的TADs的结构变化,因为它们的染色质相互作用模式仍然与Tak-1高度相似(图5F)。因此,尽管TCP1与许多TAD边界(图2)和富含TCP1的TADs(图5)相连,但TCP1似乎对地钱草中TADs的形成不是必须的。
图3. 部分地钱草TADs与TCP1有较强的相互作用。A DNA甲基化和TCP1结合揭示了不同类型的TADs。B TCP1结合的TADs区域百分比密度图。C 富含TCP1的TADs在根据DNA甲基化定义的TAD类别中的分布。D 根据组蛋白标记,富含TCP1的TADs在TAD簇间的分布。
图4. 富含TCP1的TADs是细胞核中TCP1蛋白斑点的一部分。A, B 抗TCP1抗体免疫组化染色:野生型核(TAK-1)(A),TCP1基因敲除核(B)。C-F TCP1蛋白的空间定位和富含TCP的TADs的筛选。Hi-C图谱,TCP1 Chip-Seq信号以及免疫染色和FISH数据显示了5号染色体(C,D)和2号染色体(E,F)上一个富含TCP1的TAD,其中标有蓝色片段的TAD区域被标记为FISH。
图5. 关于TCP1-染色质相互作用的富含TCP1的TADs的特征。A 显示TCP1 Chip-Seq峰分布的饼图。B 分析富含TCP1的TADs上的TCP1-染色质相互作用。C,D 比较TCP1 Chip-Seq峰宽(C)和密度(D)。E 野生型和tcp1突变体TADs的隔离数值比较。F 在tcp1突变体中没有发现富含TCP1的TADs的剧烈变化。
4 富含TCP1的TADs为基因表达提供了抑制环境
如上所述,TCP1可以直接与活性基因和抑制基因结合(图2C)。有趣的是,位于TCP1丰富的TADs中的TCP1靶基因比分布在基因组其他地方的TCP1靶基因的表达活性要低得多(图6A,B)。这与研究人员的观察结果相关,即富含TCP1的TADs被H3K36me3修饰耗尽,这表明在富含TCP1的TADs中,TCP1蛋白与抑制环境有关。
接下来,研究人员比较了tcp1突变转录组和野生型转录组,以深入了解基因表达是如何受到影响的,特别是关于富含tcp1的TADs。研究人员发现与TCP1有广泛相互作用的基因在tcp1中往往会上调。在基因组水平上,TCP1目标基因比未被TCP1结合的基因显示出更大程度的表达变化。有趣的是,TCP1靶基因的基因表达变化程度也与3D基因组位置有关。根据TCP1靶基因是否与哪种类型的TAD重叠对TCP1靶基因进行分组后,研究人员发现那些驻留在TCP1丰富的TADs中的基因表达变化最大(图6C)。需要注意的是,大量的TCP1非靶基因在tcp1中存在差异表达。事实上,在tcp1突变体中,大多数差异表达的基因都是tcp1非靶基因。在突变体中上调和下调的1595个和760个基因中,只有37.9%(605/1595)和29.2%(222/760)分别与TCP1结合,表明TCP1转录组的变化主要反映了TCP1缺失的间接影响。TCP1的缺失不仅影响了TCP1富含TADs中的TCP1靶基因,也影响了TADs中驻留的TCP1非靶基因。对于TCP1非靶标,研究人员发现更多的差异表达基因位于TCP1丰富的TADs中。此外,与富含TCP1的TADs重叠的TCP1非靶基因显示出比其他基因更大的表达变化(图6D)。因此,不管它们是否被TCP1结合,富含TCP1的TADs中的基因在TCP1中的表达变化程度比基因组中其他基因要大。
图6. TCP1缺失对基因表达的影响。A 根据基因相对于TADs的位置分组的基因表达。B TCP1靶基因定位与表达的相关性。C,D 小提琴图谱显示tcp1基因敲除突变体的基因表达分布变化。
结论
在本研究中,研究人员详细分析了地钱草基因组常染色体上的TADs。研究人员发现,根据它们的表观遗传状态,它们可以分为不同的类型。研究人员揭示了一种含有地钱草 TCP1转录因子的TAD,研究人员称之为“富含TCP1的TADs”。然而,TCP1功能的丧失不会导致3D染色质组织或富含TCP1的TAD结构的急剧改变。在tcp1突变体中,与位于这些TADs之外的基因相比,位于TCP1丰富的TADs中的基因表现出更大的表达变化。研究人员的工作揭示了一种含有大量转录因子的植物TAD,它定义了调节基因表达的功能核区。
更多推荐
1 科研 | NAT PLANTS:多重组学揭示荒漠藻类对极端光照的完全抵抗机制
END