正常组织广泛存在体细胞突变(2019年第25期文献)
转眼间,我们生信技能树的《逆向收费文献阅读俱乐部》已经停更了一年有余,上一期是:日本人的乳腺癌易感基因队列研究(逆向收费读文献2019-24)。
目前我还没有想好,后面这个俱乐部该何去何从,不过坚持读文献,是科研生涯必修功。接下来我们进入2019年第25期文献,这次的文献是关于一个科研话题,正常组织广泛存在体细胞突变,而不仅仅是一篇文章的解读。
Wellcome Trust Sanger研究所的 Peter J. Campbell博士 的每一篇文章出来,都是一个大新闻,比如:
每天抽一包烟导致肺细胞每年产生150种突变 中年人中约有1%的正常结直肠隐窝携带驱动基因突变 子宫癌第一个癌症驱动突变“种子”,儿童时期就种下了!
因为他的研究兴趣就集中在正常组织的体细胞突变,算是一个冷门方向。
背景介绍
做肿瘤的基因突变研究的时候,通常是需要测肿瘤组织本身加上该病人的正常组织两个样品,这样的话,病人本身的正常组织的germline 突变就可以别减去,从而拿到真正的somatic突变位点。
germline,胚系突变又叫生殖细胞突变,是来源于精子或卵子这些生殖细胞的突变,因此通常身上所有细胞都带有突变;
somatic 体细胞突变又叫获得性突变,是在生长发育过程中或者环境因素影响下后天获得的突变,通常身上只有部分细胞带有突变。
但是这样的研究背后有一个假设,就是每个人的正常组织是不会携带体细胞突变的,但是Wellcome Trust Sanger研究所的 Peter J. Campbell博士 团队的这5年的CNS文章就是为了反驳这一点。
时间线
关于正常组织的体细胞突变研究,Wellcome Trust Sanger研究所的 Peter J. Campbell博士 在这个领域钻研了很久,我准备解读这个话题的时候还是2019上半年,现在正式开始解读的时候就发现,又多了3篇nature文章。
早在 Science. 2015 May 的关于 正常人(three female and one male, ranged from 55 to 73 years of age)的皮肤细胞. 2016年11月4日那期Science期刊上,论文标题为“Mutational signatures associated with tobacco smoking in human cancer 发现每天抽一包烟导致肺细胞每年产生150种突变。 接着是 Science (2018.11) 研究9个志愿者的844个食管组织测序。 然后还有 September 2018 从体细胞突变推断正常人血液的群体动态 ,对一名59岁健康男性的140个单细胞衍生的造血干细胞和祖细胞聚落以群体遗传学方法重建克隆动态。 接下来是nature,October 2019 ,论文标题是 The landscape of somatic mutation in normal colorectal epithelial cells ,仍然是LCM方法取42个人的2,035 individual colonic crypts进行WGS,分析SNV的突变特征频谱以及CNV和SV,还有克隆进化。 仍然是2019年10月,在***Nature***上发表文章***Somatic mutations and clonal dynamics in healthyand cirrhotic human liver***,报道了首个大规模人类正常肝组织和硬化肝组织的体细胞突变图谱及其与肝细胞癌(hepatocellular carcinoma)体细胞突变模式的联合对比分析。 接下来还是nature,22 April 2020,论文标题是The mutational landscape of normal human endometrial epithelium
值得一提的是,Peter J. Campbell博士还是TRACERx Renal计划的负责人之一,第一期就对来自33名患者的95个肾癌肿瘤的全基因组进行了测序和分析。 仅仅是这个TRACERx Renal计划就发表了5篇CNS文章。
因为CNS文章太多了,根本就没办法解读它们了。单独任何一篇文章,数据分析任务都很繁琐。
其实GTEx计划是正常组织最多的地方
虽然Peter J. Campbell博士这五年做了七八篇CNS,关于正常组织的突变,但是都是通过DNA测序层面。其实GTEx计划是正常组织最多的地方,GTEx数据库可以很容易检索到:
2015年,GTEx发布了第一个阶段性成果,一次性在Science杂志上发表三篇研究成果,该成果还被选为封面文章。 GTEx的研究从175名死者身上采集到了1641个尸检样本,这些样本来自54个不同的身体部位,对几乎所有转录基因的基因表达模式进行了观察,从而够确定基因组中影响基因表达的特定区域。 在2017年,一次性在nature发表4篇研究成果 GTEx研究联盟的研究收集并研究了来自449名生前健康的人类捐献者的7000多份尸检样本,涵盖44个组织(42种不同的组织类型),包括31个实体器官组织、10个脑分区、全血、两个来自捐献者血液和皮肤的细胞系
因为GTEx数据库里面的都是RNA-seq数据,虽然也是正常组织,找变异会稍微有点麻烦。所以Broad 研究所Gad Getz 教授领导的研究团队开发了一种新的RNA测序分析方法,名为RNA-MuTect。利用该方法,人们可在任何疾病发生前,利用组织来源的RNA测序数据及其匹配的正常DNA鉴定体细胞突变。在2019年6月发表的研究中分析了来自基因型-组织表达(GTEx)项目488名个体的29种正常组织的RNA数据,并匹配GTEx项目488名个体的血液DNA样本,共计6,707个RNA测序样本。见:
https://science.sciencemag.org/content/364/6444/eaaw0726
这样的话,前面Wellcome Trust Sanger研究所的 Peter J. Campbell博士 的很多研究就可以被验证一番了。
另外一个值得推荐的文章是:2020年1月6日,来自哈佛医学院生物医学信息学系的Peter J. Park教授实验室团队(第一作者为窦岩梅博士)在***Nature Biotechnology***发表论文“Accurate detection of mosaic variants in sequencing data without matched controls”, 该研究开发了一个基于机器学习的工具“MosaicForecast”。与现有其他算法相比,MosaicForecast的检测特异性提高了数倍:实验验证显示MosaicForecast在一组全基因组数据中单碱基体细胞突变验证率达到80-90%,对短序列插入缺失达到60-80%的验证率。