科研 | Nature Genetics:基因组、转录组以及表观遗传组学确定了不同HPV分支感染个体中宫颈癌

编译:小北,编辑:夏甘草、江舜尧。

原创微文,欢迎转发转载。导读

宫颈癌是影响撒哈拉以南亚洲女性最常见的癌症并且在HIV阳性的个体中盛行。目前为止对这一肿瘤基因组、转录组以及表观遗传组学的综合图谱尚未进行。研究者对乌干达病人中118个肿瘤进行描述,其中72例HIV阳性,在另外89例肿瘤中进行了突变分析。研究者检测了肿瘤DNA甲基化、启动子和增强子相关组蛋白标记,基因表达以及信号通路异常调节中HPV分化枝特异的差异。在HPV集成事件中组蛋白修饰的改变与邻近基因和内源性逆转录病毒的上调相关。

论文ID

原名:Analysis of Ugandan cervical carcinomas identifies human papillomavirus clade–specific epigenome and transcriptome landscapes

译名:乌干达宫颈癌分析确定人乳头瘤病毒分支-特异表观基因组和转录组

期刊:Nature genetics

影响因子:27.603

发表时间:2020年8月

作者:Marco A. Marra

单位:加拿大的 Michael Smith 基因组科学中心

DOI:10.1038/s41588-020-0673-7.

前言

持续的HPV感染,以无鞘型还是整合型的形式都是宫颈癌发展的必要不充分条件。至少70%受影响的个体中检测到HPV-16和HPV-18。HPV-16 (分支A9)在鳞状细胞癌以及腺癌中常见,而HPV-18(分支A7)与腺癌和生存期低下相关。

预防宫颈癌的策略包括疫苗接种、HPV筛查以及晚期癌症癌前治疗。尽管有效,疫苗的应用在HIV盛行的低等或者中等收入的国家仍然很低。资源限制同样使筛选、手术以及放疗复杂化,以致于预测到2040年宫颈癌的死亡率增加50%。

对宫颈癌基因组的研究主要在非亚洲个体中进行,确定了APOBEC突变的特征,CD274 (PD-L1)以及PDCD1LG2 (PD-L2)拷贝数的扩增,影响PI(3)K–MAPK和TGFβR2信号通路的体细胞突变以及染色质修饰基因的突变。对HPV感染且患有头颈癌的个体研究将HPV融合与组蛋白修饰以及DNA甲基化的改变相联系,提示在宫颈癌中相似的发现。

作为国际癌症组织HIV阳性肿瘤分子特征描述项目(HTMCP)的一部分,研究者对乌干达病人宫颈癌的基因组、转录组以及表观遗传图谱进行描述。研究者确定了不同HPV分支感染个体中宫颈癌表观遗传学和转录组学之前未描述的差异,并且说明这些分支与预后相关。

结果病人样本和临床数据

研究者研究的212例宫颈癌患者在坎帕拉乌干达癌症学院接受治疗。其中118例构成了研究者的发现队列,89例构成了扩展队列。HIV阳性的患者(72/118, 61%)比HIV阴性的患者平均年轻10岁。

HIV阳性和HIV阴性的宫颈癌基因组的改变

对发现队列中样本进行全基因组测序确定了平均每个样本中22942个体细胞突变(从3033-179513变化),包括311个编码突变(从30到2683变化)(图1a)。研究者检测了APOBEC突变体特征2和13,证实之前的报道并且与对病毒感染的细胞内应答驱动的突变过程一致(图1a)。具有高比例APOBEC特征突变的肿瘤(比例≥ 0.4)表现出更多的编码突变。15个样本(13%)从中度到高度同源重组缺失的分值(HRD>30),提示HR损伤信号通路的异常功能(图1a)在HIV阳性和HIV阴性样本中对突变体负荷、突变体特征或者HRD分值之间没有差异。

在研究队列12个显著突变的基因(SMGs) 中PIK3CA是最常见的(图1a),正如其他研究报道的一样。HIV阴性的肿瘤中具有更高比例的PIK3CA突变体,并且PIK3CA的表达高于1.3倍。其他SMGs包括FAT1, KMT2D, FBXW7, CASP8, MAPK1, ZNF750之前在宫颈癌中均有报道。值得注意的是,87%的队列中在一个染色质修饰基因上至少有一个突变体。

研究者对扩展队列中2735个特异基因进行靶向测序,证实12个SMGs中有11个突变体并且在发现队列和扩展队列之间发现相似的突变频率。

对拷贝数图谱分析发现HIV阳性和HIV阴性的样本中具有大量可比较的拷贝数突变体,在1,8,20号染色体3q, 5p,19q上扩增,在11号染色体3p, 4p, 19p,21p上缺失(图1b)。研究者发现HIV阳性的样本中有6个特异性的扩增和4个特异性的缺失,而在HIV阴性的样本中有两个特异性的扩增(图1b)。HIV阳性的样本具有更多特异的病灶的扩增和缺失(图1c)。

研究者比较了HIV阴性样本中的拷贝数图谱与TCGA宫颈癌中的样本。TCGA样本表现出更多数量显著缺失的区域,影响了11条染色体,然而在研究者的队列中仅21p是缺失的。通过与TCGA比较,研究者的HIV阴性队列在染色体3p, 8p,15q上具有三个显著扩增的区域(图1b)。在TCGA队列中确定的5个病灶扩增和9个缺失同样在研究者HIV阴性的队列中检测到(图1c)。对TCGA或者HIV阴性样本特异的病灶缺失在数量上是可比较的,并且多于病灶扩增。11q22.1和11q22.2,包含YAP1,在HIV阳性、HIV阴性以及TCGA样本中是扩增的。12个SMGs中有6个受拷贝数突变的影响,其中PIK3CA是突变频率最高的基因,通过突变体或者拷贝数改变(图1a)。

图1 乌干达宫颈癌突变图谱

频发的非编码突变体

研究者通过全基因组测序确定了7个高度可信的非编码“热点”(图2a),包括最初在黑色素瘤中描述的TERT启动子中的两个,占研究者发现队列样本的11% (13/118)。TERT转录本的水平在所有样本中并未受到异常调节。在9% (11/118)的样本中观察到ADGRG6内含增强子中的两个热点。这些非编码的突变体,chr6:142706206(G>A)以及chr6:142706209(C>T),坐落在回文序列预测将形成发卡环路,有利于APOBEC酶的进入(图2b)。据报道这些热点大约在乳腺癌中占3%,在膀胱癌中占46%,并且与ADGRG6蛋白表达升高以及血管生成相关。在突变的样本中研究者并未观察到ADGRG6 mRNA表达的异常。在6,8,11号染色体上三个其他的热点并不与启动子或者增强子相关。在HIV阳性和HIV阴性的样本中所有报道的热点以及具有突变体的样本(C>T或者C>G)具有中等APOBEC特征的突变体比例(图2a)。因为TERT启动子突变体能够产生c-ETS转录因子新的结合位点,研究者探究了其他非编码热点改变转录因子结合位点的潜能(图2c),并且说明七个热点中有五个,POU和FOX家族结合位点由突变体产生或者破坏。

图2 频发的非编码突变

HPV类型的分布

全基因组测序检测了17种HPV类型以及在研究者的队列中相关的分支。高危HPV-16 (分支A9), HPV-18以及HPV-45 (分支A7)是最广泛的类型(图3a),并且分支A7在研究者的队列中比TCGA队列特别是鳞细胞癌中更加普遍(图3b)。与之前的报道不同的是,在HIV阳性和HIV阴性中并未发现HPV类型的差异。

表达量、甲基化图谱以及HPV分支

研究者通过对突变表达最高的基因(n = 1,000)以及突变甲基化最高的探针(n = 8,000; 850k EPIC)分别进行无差别的聚类绘制表达和DNA甲基化图谱,并且与基因的特征相关联。研究者确定了三个基因表达集簇,在腺癌(q = 4.1 × 10−8; 集簇1)、无角化的SCCs(集簇3)以及角化的SCCs(q = 0.015;集簇2)中富集,与之前的报道相似。此外,集簇1在分支A7 HPV样本中富集(q = 1.3 × 10−9),集簇3在PIK3CA突变的样本中富集(q = 3.1 × 10−5)。两个DNA甲基化集簇(图3c)证实了从分支A7 HPV鳞状或者非鳞状癌症(集簇2; q = 1.7 × 10−13)中分离分支A9 HPV的SCCs(集簇1)。集簇2在晚期肿瘤样本中富集(q = 0.020)。

研究者通过甲基化差异分析比较了分支A7感染的样本与分支A9感染的样本,确定了107685个差异的甲基化探针(DMPs),包括分支A9 HPV肿瘤中46,639 DMPs以及分支A7 HPV肿瘤中61,646 DMPs (FDR < 0.05)。DMPs基因特征以及邻近CPG岛的分布因分支不同。在游离或者支架CpGs上的DMPs分支A7是最常见的,并且大都在内含子区域。在CPG岛上的DMPs最常见的是分支A9,并且这些大部分坐落在转录调节区域。

在分支间DMP分布的差异是明确的,研究者在解释了组织差异后检测了721个差异表达的基因,在每个分支中基因上调的比例大约相同(A7, n = 363; A9, n = 358)。功能富集分析(图3d)发现本体的富集与分支A9 HPV的角化以及上皮分化相关。在这些样本中表达升高的基因包括角蛋白家族基因以及AMTN, LCE3D,BCL2L10。紧密调节的角化分化信号通路在HPV感染中被利用,产生活化的病毒以及宫颈上皮细胞中不受控制的细胞生长。分支A7 HPV样本中PROM1, TGFB2, PXDN以及FN1的表达升高并且差异表达的基因在细胞外基质组织、细胞粘着和侵袭相关的信号通路中富集,这与侵袭性肿瘤等级与分支A7相关是一致的(图3c)。

为了将启动子区域DNA甲基化的效应与基因表达改变相联系,研究者确定了甲基化差异的区域,由附近的探针显示出一致的甲基化变化定义,并且这些区域与基因表达相关。与分支A9 HPV中CPG岛DMPs的数量更高一致,研究者在这些样本中确定了558个甲基化的DMRs,在分支A7 HPV样本中有53个甲基化的DMRs。在A7 HPV样本中26个上调的基因与A9 HPV样本中甲基化的DMR相关,而在A9分支 HPV样本中只有8个上调的基因与A7 HPV样本中的1个甲基化DMR相关。因此在分支间差异基因的表达可能是由于甲基化的差异导致的。

图3 HPV分支特异的分子特征和诊断

HPV病毒基因表达影响宿主基因表达

HPV病毒基因调节上皮细胞的分化并且促进肿瘤发生,为了探究病毒基因表达对肿瘤基因表达的影响,研究者对病毒E1, E2, E6以及E7的转录本进行无差别的聚类,所有HPV类型在GenBank中进行相关注释,研究者确定了三个集簇。集簇1在分支A9 HPV肿瘤中富集(q = 0.0029),具有较高的E2和较低的E6表达,提示显著的HPV外泌体转录。集簇2,在分支A7 HPV肿瘤中富集(q = 0.0029),具有较低的E2和较高的E1表达。集簇3包含两种分支的HPV肿瘤并且E1和E2的表达水平都很低。由于缺乏E2表达,研究者推断集簇2和3反映了病毒的表达起源于HPV的整合形式。E6和E7的表达分布是双向的并且研究者利用差异表达分析将其应用于将样本分离为高表达的和低表达的肿瘤。研究者在高表达和低表达E6的肿瘤间确定了107个差异表达的基因,并且在高表达和低表达E7的肿瘤间确定了60个差异表达的基因。高表达E6组中的基因与分支A7富集的信号通路重合,而低表达E7组中的基因与分支A9富集的信号通路重合。因此,分支富集的肿瘤基因表达图谱可能受HPV基因表达的影响。

HPV分支与预后相关

与研究者的观察一致分支A7 HPV肿瘤的表达图谱提示一个更加侵袭性的表型(图3c、d),这些肿瘤也在临床上提示更加具有侵袭性,与A9感染的病人相比A7感染的病人预后更差。这一观察在研究者队列的其他协变量研究后仍然是真实的,包括HIV的状态(图3f)。阶段以及组织学。尽管可用于分析的病人数量很小,HPV分支对整个生存期的影响与疾病阶段相似(HR = 2.10, P = 0.19),后者已经成为一个诊断的因素。相似的结果在之前也有报道。

与HPV分支相关的组蛋白图谱

受DNA甲基化结果(图3c)以及染色质修饰基因上体细胞突变的刺激,研究者探究了组蛋白修饰是否也表现出分支特异性的差异。通过ChIP-seq实验,研究者对52个样本中转录活化的四个组蛋白修饰标记物(H3K4me1, H3K4me3, H3K27ac,H3K36me3)以及转录抑制相关的两个标记物(H3K9me3,H3K27me3)进行图谱绘制。对这些标记物进行聚类分析确定了代表启动子和增强子相关标记物H3K4me1, H3K4me3,H3K27ac的聚类方法。因此研究者利用这三个活化的标记物再次进行了分析确定了四个集簇(图4a)。集簇1在分支A9 HPV肿瘤中富集(q = 4.9 × 10−5),而集簇2包括相同数量分支A7 HPV和分支A9 HPV肿瘤。剩余的分支A7 HPV肿瘤在集簇3和4中发现,并且在非SCC肿瘤中富集。没有集簇在染色质修饰复合体的基因编码成员体细胞突变中富集,而集簇4在SEC, NuRD, HDAC,ISWI复合体成员中没有突变(图4a)。

观察到HPV分支特异性的差异,研究者评估了分支是否与调节区域组蛋白标记物不同的丰度相关,包括活化的启动子(H3K27ac,H3K4me3)以及增强子(H3K4me1)。研究者在组织学差异校正后确定了分支间15,245个H3K4me1峰值、9,902个H3K27ac峰值以及7,736个H3K4me3峰值(图4b)。

分支A7感染的样本具有三倍多的H3K4me1富集的区域(11,530个分支A7 vs 3,715个A9分支),以及大约两倍数目的H3K27ac富集的区域(6,405个分支A7 vs 3,497个分支A9),提示增强子的富集。相反,在分支A9 HPV肿瘤中几乎两倍数目的H3K4me3差异峰值(4,997个分支A9 vs 2,739个分支A7),以及1/4的与H3K27ac富集的区域重合,提示分支A9 HPV在肿瘤启动子区域的富集(图4b)。

在研究者的研究队列中有两个最常见的染色质修饰基因突变,KMT2C和KMT2D,在增强子区域沉积H3K4me1。研究者因此探究了KMT2C和KMT2D功能缺失突变对H3K4me1标记区域数量上的影响。研究者观察了KMT2C或者KMT2D功能缺失突变的15个样本,待发增强子区域的数目低于染色质修饰基因没有突变体的肿瘤或者在其他染色质修饰基因上有突变,而在活化增强子区域(由H3K4me1和H3K27ac标记)的数目没有差别(图4c)。尽管在HPV分支间不同的峰富集(图4b),KMT2C和KMT2D突变体对待发增强子的影响并不是分支特异的。

为了将染色质标记物图谱与差异表达联系,研究者绘制了邻近基因区域差异的H3K27ac和H3K4me3的峰值图。在差异H3K27ac和H3K4me3峰富集的分支A7 HPV样本中确定了769个区域,其中18个靠近基因TSS的区域在分支A7 HPV样本中上调,包括侵袭和细胞外基质基因SRCRB4D、PXDN以及CXCL2(图4d)。研究者也在分支A9 HPV样本中差异的H3K27ac和H3K4me3峰中确定了1271个区域,其中25个靠近基因TSS的区域上调(图4d),包括TMPRSS11A, WNT2B,MEI1。研究者同样在H3K4me1标记的差异区域和最靠近基因的表达之间观察到了分支特异性的相关性(图4e)。在图4f中展示了分支之间组蛋白修饰和基因表达差异之间的关系,例如PXDN 和TMPRSS11A。

研究者的结果提示DNA甲基化(图3c)和H3K27ac, H3K4me3,H3K4me1的表观修饰图谱以HPV分支特异性的方式改变。

图4 HPV分支特异的组蛋白标记物图谱

在HPV整合位点改变的RNA和组蛋白图谱

研究者研究了118例肿瘤的109例中1010个特异的HPV整合位点的基因组。在样本中邻近整合位点分组确定了257个整合事件。分支A7整合事件包含更多的整合位点。

在这些事件中155 (60%)在一个或者更多基因的10kb之内。如之前的报道一样,在16个基因中KLF12, TP63, RAD51B,MYC在多个样本中最靠近整合位点(图5a)。靠近整合事件的基因有61例的表达显著更高。此外包含更多整合位点的事件与表达的倍数升高相关(图5b)。分支A7整合事件比分支A9事件对表达具有更广泛的影响(图5c),可能是分支中每个事件整合位点的数目导致的。在靠近整合事件的多个样本中确定了16个基因(图5a),其中8个在整合的样本中显著上调,包括促癌基因ERBB2和TP63。

为了探究在HPV整合事件中基因表达改变可能的表观遗传学机制,研究者检测了整合事件中组蛋白标记物富集的倍数。H3K27ac, H3K4me3,H3K4me1,H3K36me3组蛋白标记富集倍数的改变与基因表达改变正相关(图5d)。在研究者无差别的聚类分析中,研究者注意到经典的与转录相关的H3K36me3升高与整合事件中局部转录的异常调节相关。KLF12的3’端区域提供了一个直观的例证。说明了一个HPV整合事件中改变的组蛋白修饰和基因表达升高存在联系。

对靠近整合事件组蛋白修饰的倍数进行无差别的聚类确定了组蛋白标记富集变化的三个集簇(图5f)。集簇3包含H3K27ac, H3K36me3, H3K4me3,H3K4me1覆盖率升高的12个事件。其中7个事件抑制的修饰H3K9me3和H3K27me3显著富集。集簇2与集簇3相比包含所有活化组蛋白修饰富集更低的49个事件,而集簇1包含的事件在所有活化的组蛋白修饰中并没有富集。每个事件上HPV整合位点的平均数目在三个集簇中显著不同,而集簇3具有最高的数目。与研究者的观察一致,更高数目的HPV整合事件与邻近基因的表达升高相关(图5b),尽管集簇3与表达升高最大的基因相关(图5h)。与没有抑制标记富集的事件相比,富集活化和抑制修饰的事件损伤了邻近基因的上调(图5h)。

可利用ChIP数据的样本中32例(32/99)整合事件并不在蛋白编码基因的10kb之内,但是与邻近组蛋白修饰图谱的改变相关(集簇2和3)。研究者因此探究了这些事件中受影响的其他基因组特征,确定了靠近114/257事件(44%)内源腺病毒的序列(ERVs)。ERVs在人类基因组中表观沉默,并且它们的再次活化与抗病毒信号通路的产生相关,例如dsRNA应答信号通路。研究者对邻近整合事件ERVs的表达进行分析,并且在整合的样本中发现表达水平显著更高,并且与HPV插入数目正相关(图5i)。和基因一样,邻近整合事件中ERVs的上调与组蛋白修饰的改变相关。

图5 HPV整合改变了局部组蛋白修饰和表达

为了探究肿瘤微环境并且确定ERV表达的升高与免疫细胞升高是否相关,研究者利用RNA-seq对免疫细胞表达的分值进行推断。在整合事件中ERVs上调的样本具有更高的T细胞分值。但是由于这些样本中肿瘤内含物低于估计值,并且研究样本中肿瘤内含物和整体的免疫分值之间的紧密关联,研究者并不能评估ERV上调和免疫丰度之间的关联。研究者也检测了参与ERV识别信号通路中基因的表达,包括类型I干扰素信号通路(GO:0060337)以及dsRNA识别的信号通路(GO:0043330),但是研究者并未发现ERV整合事件中基因的表达升高或者通过点突变、这些基因的缺失或者甲基化导致的免疫逃逸。

由于HIV感染靶向CD4+ T细胞,研究者比较了HIV阳性和HIV阴性患者的CD4+T细胞分值。在HIV阳性样本中整体的CD4+T细胞分值低于HIV阴性的样本,特别是小囊的辅助型T细胞的分值,与HIV感染主要影响这些细胞一致。免疫分值仅在HIV阳性的样本中发现更高的是嗜中性白细胞,其在生殖道粘膜环境中的作用尚不清楚。

这些结果提示在肿瘤基因组中HPV整合位点与局部组蛋白修饰的改变相关,组蛋白修饰的改变与基因和ERVs的表达改变相关,包括已知的促癌基因ERBB2,可能促进肿瘤的进展。

结论

研究者对乌干达病人宫颈癌的基因组、转录组以及表观遗传图谱进行描述。研究者确定了不同HPV分支感染个体中宫颈癌表观遗传学和转录组学之前未描述的差异,并且说明这些分支与预后相关。组蛋白修饰的改变与基因和ERVs的表达改变相关,包括已知的促癌基因ERBB2,可能促进肿瘤的进展。

更多推荐

1  高分综述 | Trends in Biotechnology: 单细胞分辨率下利用空间转录组揭示器官分子结构(国人佳作)2 重磅综述 | Cell:非编码RNAs在肿瘤学中的作用(IF=36.216)

(0)

相关推荐