NC: WGS预测结直肠癌疗效和转移位点特征

研究背景

与原发性结直肠癌(primary colorectal cancer, CRC)相比,人们对转移结直肠癌(metastatic CRC, mCRC)的基因组全景了解的并不多。在本研究中作者通过对一个接受了不同治疗的429人的mCRC队列进行全基因组测序分析WGS,得到mCRC的分子全景图,并探究不同的预先治疗对mCRC基因组的影响,原发CRC与mCRC在基因组上的区别,并全面分析了该队列的突变特征。

分析流程

研究结果

1. 队列概况

本研究用到的队列为429名转移结肠癌患者(mCRC)。拥有429名患者的WGS数据,以及91名患者的RNA-seq数据。基于WGS数据,14名患者被发现为微卫星不稳定型(MSI)。其中,284名患者接受了不同的预先治疗(13种),而124名患者在获取样本前未接受任何治疗。PLAT指oxaliplatin,PYR指fluoropyrimidine,TOP指Irinotecan,+targeted指VEGF靶向抑制剂,CHEMCOM指联合治疗。

根据91个样本的RNA-seq数据,得到这些样本的CMS分型(Consensus Molecular Subtype)。使用CMS-classifier包,得到CMS1型10个,CMS2型41个,CMS3型0个,CMS4型14个。剩下29个样本不能被分型,可能是因为样本中混有非结肠区域的普通细胞。使用CMSCaller算法,减少了一部分未被归类的样本,得到CMS1型21个,CMS2型25个,CMS3型3个,CMS4型27个。不论哪种算法,CMS4中的肿瘤细胞比例要显著低于其他亚型,之前也有研究报道CMS4有较高的基质成分。

表1 mCRC队列的基本信息

2. mCRC的分子全景图

通过对429个mCRC患者的WGS数据分析,提取出单核苷酸突变SNVs,多核苷酸突变MNVs,结构突变SVs,插入/缺失InDels以及拷贝数变异CNVs。

图一是不同结构突变SV的大小分布密度图。较广范围的串联重复(Tandem Duplication,TD)在mCRC中被发现,范围为14-93kb,峰值为26kb。这与在其他肿瘤中被报道的TD大小并不相同。

mCRC中发生的基因转位(Inversion)大小一般在10Mb以上。

缺失(Deletion)的范围在10kb-1Mb间,峰值出现在128kb。在峰值处的事件包含了很多在常见易损位点发生的重复缺失事件。比如基因FHIT、RBFOX1和MACROD2。这种现象在原发的CRC中也被报道过。

图1 不同结构突变的大小分布

根据体细胞核苷酸突变中非同义突变和同义突变的比值,确定了23个基因为驱动基因。展示在图2当中。在99.1%的样本当中,这23个基因中至少有一个驱动基因发生突变。

这里确定驱动突变用到的是dN/dS模型,可以用R包dndscv做。

图2 mCRC队列的分子突变全景图

对这些基因突变的互斥性进行检验。KRAS与BRAF/NRAS/RNF43/TP53间的突变是显著互斥的。

mutual exclusivity检验使用discover包做的,Canisius, S., Martens, J. W. & Wessels, L. F. A novel independence test for somatic alterations in cancer shows that biology drives mutual exclusivity but chance explains most co-occurrence. Genome Biol. 17, 261 (2016).

附图1 基因突变的互斥性检验结果

在mCRC中,15个非编码基因的突变率与周围非注释区域比显著升高,他们可能与癌症的发生过程有关。其中包括PTENP1,一个CRC中已知的抑制因素。MALAT1,在一个泛癌分析中被报道有突变率的升高。LINC00672,被报道可以提高化疗敏感性。

为了更好的研究观察到的SNVs和MNVs,使用COSMIC突变特征(一些预定义的突变特征),研究mCRC中这些预定义的突变特征的表现情况。一共识别出了主要的11个单碱基特征(single base signature,SBS)和9个双碱基特征(double base signature,DBS)。(要求至少在10个样本中相对贡献在10%以上)。使用NMF算法并没有在原有的COSMIC特征外找到新的突变特征。

突变特征是使用R包MutationPatterns分析的,关注于单碱基或双碱基突变特征。同样可以用NMF算法去分析新的特征

3. 系统的预先治疗对基因组的影响

与未接受预先治疗的患者相比,接受了系统的预先治疗的患者表现出更高的TMB,更多的SVs,CNV regions,以及更高频的染色体碎裂。

作者观察了两组在几个突变特征相对分数的变化。在预先接受了PLAT/PYR+ target治疗的患者中,SBS8,SBS17b,SBS35,DBS5这些突变特征显著增加。这些突变特征与药物的关系在之前的研究中都有被报道过。

图3 是/否接受预先治疗组之间显著差异的基因突变特征

虽然TMB在预先接受治疗的患者中显著增高,但总体上没有特定突变与这些预先治疗有关联。在特定区域的CNV上,发现预先接受治疗的患者总体上在6p22.1,6p21.1和18p11.32这些位点扩增频率要显著升高,在3p14.2和8p21.3上的缺失频率也显著增多。某些位点的CNV改变只与某种特定治疗相关。

附表2 CNV存在显著差异的位点的统计结果

4. 转移CRC和原发CRC的比较

这里用到了几个公开数据库中的CRC和mCRC数据,如下表。其中TCGA-DFCI队列和Yeager队列用于比较基因突变频率上的差异。PCAWG队列用于比较突变特征上的差异。ICGC队列用于比较非编码突变的突变频率。

附表1 本研究中用到的结直肠癌队列

上述关于mCRC的特征与之前报道的原发CRC的特征有一定关联,可以从中寻找与转移过程可能有关的改变。

这里在未接受预先治疗的mCRC样本(n=124)与PCAWG中CRC队列(n=73)间做突变特征上的比较。存在显著差异的突变特征展示在Figure4当中。图中的这些突变特征在mCRC中显著升高,提示他们可能与转移过程相关。

图4 CRC和mCRC间存在显著差异的基因突变特征

在所有mCRC样本(n=429)与TCGA-DFCI队列中的原发CRC间比较基因突变频率上的差异。将TCGA-DFCI队列中突变频率在5%以上的基因做为目标,与mCRC队列比较相应基因的突变频率是否有差异。结果在表2当中。mCRC在TP53,ZFP36L2,KRAS,APC的突变率上显著上升,而在PIK3CA中显著下降。

表2 突变频率存在显著差异的驱动基因

表2中给出的是驱动基因的突变频率差异,其中Yaeger队列是作对照的另一个mCRC队列(n=321)。附表三中给出了在mCRC队列中突变频率显著降低的非肿瘤驱动基因的统计结果。

附表3 mCRC队列中突变频率显著降低的非驱动基因

同样比较了mCRC和原发CRC在推定的驱动非编码突变上的突变频率差异。这里的原发CRC队列是同样采用WGS的ICGC队列(n=866)。结果如表三所示。除了PIPSL和PTENP1外,所有非编码驱动突变都在mCRC队列中富集。

表3 非编码基因的基因突变频率差异

5. mCRC患者患者中不同的突变特征

根据mCRC样本突变特征的无监督层次聚类得到了三个主要的组别和三个次要的组别。突变特征包括20个主要的突变特征、经报道的原位CRC特征(SBS15/17a/28/37 and DBS10)以及至少在一个样本中相对分数大于25%的特征(SBS10a/10b)。

三个主要的组别是聚类1、3和6。聚类1标注为prior treatment组,聚类6标注为primary-like组。分别在相应的突变特征上相对分数高。聚类6中也富集了表达E. coli突变特征的样本(>5%contribution),这是一个最近在CRC中报道的突变特征。

聚类3标注为mCRC-specific型,该型样本以较高的SBS9/37/39/41突变特征分数为特点,这些在原发CRC中几乎是检测不到的(除了SB37)。该型样本中混合了接受或未接受化疗的患者。

聚类5中只包含了14个样本,但他们都拥有较高的TMB(>10/Mb),被标记为high TMB组。与DNA错配修复(mismatch repair)相关的突变特征SBS15/44,以及DBS7是该聚类中13个MSI样本的特征。另一个样本拥有较高的SBS10a/b突变特征,该特征与POLE突变有关。

图5 基于基因突变特征绘制的聚类热图

6. MSI特定的基因突变

随后观察是否存在特定的基因突变与各个组别相关,但只有聚类5有与之相关的特定基因突变。因为在高TMB组发现任何突变的可能都会增高,故为了矫正误差随后采取置换检验(permutation test),得到28个在high TMB组显著高突变的基因。附表4给出了详细的基因的检验信息。

附表4 置换检验结果

7. 分子全景图和治疗反应的关联

该mCRC队列中有286名患者拥有治疗反应数据,用于将mCRC的分子特征和治疗反应相联系。但因为队列的异质性和治疗方法的差异,不可过度解读。

用到的方法是建立LASSO回归模型。用于建立模型的123个分子特征包含5个方面:临床特征、基因组数据、突变特征分数、驱动基因以及CNVs。先通过单因素Cox找到与治疗反应显著相关的特征,再构建多因素模型。

多因素模型中显著的分子特征在表4中展示。除了总体的情况,还对各种不同的治疗分组也做了分析。

  • 一些分子特征与治疗反应相关且不受治疗方式影响,主要是突变特征和一些驱动基因的突变。

  • CNVs主要与PLAT/PYR或PYRmono的治疗结果有关

  • FBXW7的突变预示着mCRC中靶向抗EGFR治疗更差的疗效。mCRC队列中有51个患者在该基因上有突变,其中21个患者为KARS野生型且接受了抗EGFR靶向治疗,但效果都为疾病进展PD。这说明除了KARS突变,FBXW7突变也可以作为抗EGFR治疗的阴性选择标志。之前也有研究说明对抗EGFR治疗不反应的患者中有较多的FBXW7突变。

此处单因素回归用的是MASS包汇总的polr函数,LASSO回归用ordinalNET包做。

表4 LASSO分析结果

8. 临床启示

针对91个有RNA-seq数据的样本,计算TIL值来表示肿瘤的免疫原性。虽然高TMB的样本(n=21,TMB>10)的TIL分数并没有比其他样本(n=63)显著提高,但6个MSI的样本的TIL分数要显著高于MSSH组和MSSL组。这些数据支持对MSI肿瘤的采取免疫治疗,但仅仅使用TMB可能并不能很好地反映转移CRC的免疫原性。

附图2 不同的MSI分组在TIL分数上的差异

此外在该mCRC队列中发现的其他已知标记物(on-label)包括:

  • 40名患者中的可靶向BRAFV600E突变

  • 130名尚未接受靶向抗EGFR治疗的RAS/RAF野生型患者。然而,数据表明,在130例RAS/RAF野生型患者中观察到的21例FBXW7突变应被视为使用抗EGFR治疗的禁忌症

这里的on-label标记物获取自OncoKB数据库(OncoKB数据库收集了肿瘤发生发展相关,具有临床意义的基因突变信息,每个突变有其对应的生物学效应,证据分为6个等级)。只收集了与CRC相关的1,2等级的基因突变信息。此外,mCRC样本中这些on-label基因的突变必须是High impact的结果(nonsense mutation或者frameshift mutation)

在该mCRC队列中发现的潜在未知标签(off-lable)的分子生物标记物包括:

  • ERBB2(HER2)、MET和CDK4的扩增

  • BRCA1和BRCA2通过缺失或高影响突变丢失、TSC1和TSC2通过高影响突变丢失以及PDGFRB的融合

  • 23名患者携带KRAS G12C突变,在不久的将来可能会有一种抑制剂33

总的来说,基于肿瘤分子谱,单或多靶点的治疗在55%的病人身上是可行的

图6 mCRC队列的治疗标志物汇总

以上就是本文的全部工作和结果,基于接受了不同治疗的429人的mCRC队列,作者利用全基因组测序数据、转录组数据、药物治疗结果,让我们对mCRC的基因全景图有了一定的了解,并给出了一定的临床启示。其中的分析方法和分析内容都是值得我们学习的。

编辑:周朝政

校审:杨泓 林安琪

(0)

相关推荐