小鼠模型跟人类癌症差太大了(逆向收费读文献2019-20)
系列目录
2019-13 NPC的突变特性(逆向收费读文献2019-13)
2019-14 多组学探索卵巢癌耐药(逆向收费读文献2019-14)
2019-16 小鼠TNBC模型(逆向收费读文献2019-16)
在人类癌症研究领域,基因工程小鼠模型,也就是genetically engineered mouse models (GEMMs) 和肿瘤细胞系一样,是家喻户晓的实验材料。尽管非常多的研究表明,小鼠模型得到的癌症相关基因和通路都是在人类里面可以看到的,但也有不少研究指出来了小鼠和人类的本质差异,现在就让我们来看看这样的研究吧。
论文背后的故事
为什么感兴趣这个话题呢,其实是几年前在南科大的一个蛋白质组学讲座上,听到了Siqi Liu 的分享,大概是他们发现小鼠模型跟人类癌症差太大,对我来说是蛮颠覆性的观点,因为我不是医学出身,很多知识是默认的,比如研究肿瘤小鼠模型就是在研究肿瘤,当然了,参加的会议多了,就会更新自己的知识库。
在搜索这篇文章的时候,看到了这篇文章作者的分享,很有意思的经历,摘抄分享一下:
2012年7月,第一次做小鼠腹腔注射,用了将近一个小时,现在想想可能是那只小鼠被我抓的没了脾气才让我注射的吧。
2012年年底摸索异形腺窝病灶(Aberrant Crypt Foci, ACF)的鉴定与分离方法,几度绝望。
2013年初开始收集样本、每天休息4个小时,连续十天,所谓宵衣旰食,亦不过如此吧。
2013年7月测序数据下机,对着150Gb的数据我一脸蒙逼,不知如何下手。
2014年全年原地踏步直到11月份刘老师要我写文章了才发现分析只完成了30%不到。
2015年开始狂赶进度,若干个通宵做通路分析,以至于我当时几乎能背出小鼠的所有KEGG通路及其分类信息。
2016年开始投稿,投了拒、拒了再投,如此反复,等到第一次收到Revise信息的时候已经是我投的第五个杂志了。
2017年4月,用了9天零5个小时和15罐红牛搞定了我七万两千字毕业论文,提交前一天去广州办了签证,提交后一天美国博士后面试。
人体结直肠癌动物模型
同样的,这个小鼠模型的背景知识,也只能是摘抄了,主要是PDX小鼠模型和基因工程小鼠模型。
目前人源性结直肠癌移植瘤(异种移植)模型主要分为两种,一种是将人源的结直肠癌细胞系接种到免疫缺陷小鼠体内,称为CDX模型(cell-line-derived xenograft),另一种是将来源于患者的结直肠癌组织块接种到免疫缺陷小鼠体内,称为PDX模型(patient-derived xenograft)。由于用作CDX模型的人源结直肠癌细胞系具有易获取,成瘤效果好,验证数据详实(有大量细胞功能学和药效数据可供参考)以及操作成本低等优势,在各类实验室中都有使用。
诱发型结直肠癌模型多采用化学诱发途径,常用的诱导剂有二甲基肼(dimethylhydrazine,DMH)、氧化偶氮甲烷(azoxymethane,AOM)及致炎剂葡聚糖硫酸钠(dextran sulfate sodiuln, DSS)。DMH本身不致癌,但在肝细胞内质网被氧化成甲基氧化偶氮甲醇,随胆汁进入肠腔,则会引起结直肠癌上皮癌变。
AOM/DSS小鼠模型由氧化偶氮甲烷AOM和硫酸葡聚糖钠DSS两种化学物质诱导而成,是应用最为广泛的人体结直肠癌动物模型之一。该模型基于近交系小鼠,遗传背景纯净。而且建模过程中只有两种化学试剂,操作简单、实验误差易控。因此,个体差异或可得到较好的控制。该模型已有相对广泛的研究,这些研究表明,该模型与人体结直肠癌具有相似的临床病理特征,而且一些人体结直肠癌的重要分子特征也在该模型中有检测到。
肿瘤外显子测序
总共是15个配对样本,如下:
它们的测序深度都ok,都是很基本的统计指标,如下:
生物信息学数据分析流程
作者是2013年半路出家,自己摸爬滚打自学的数据处理,很棒,其分析流程如下:
现在的肿瘤外显子流程很简单了,都是GATK的mutect2流程。
肿瘤外显子分析结果展示
通常是看SNV和INDEL的数量,突变频谱,突变的基因功能注释,突变全景图等等
这里作者选择展示的突变全景图,是这14只小鼠模型的肿瘤测序数据分析得到的显著基因,这里作者采用的是DrGap (Driver Genes and Pathways)算法检测显著突变基因。
然后,其CNV展示在附件,并没有过多谈论,大致如下:
反正我觉得很难看的图,不过考虑到这篇文章也就发在SR上面,也不好做过多评论。
突变基因的KEGG数据库注释
这里也是采用超几何发布检验,就是 hypergeometric distribution analysis (Fisher’s Exact Test) ,因为检验的KEGG通路比较多,还采用了 Bejamini-Hochberg FDR 校验,作者这里并不是对所有的somatic突变基因进行富集,而是通过对somatic突变对基因功能影响来尽可能的筛选去除乘客突变后,背景基因是2.4万个。
跟TCGA数据比较
作者标题是小鼠模型跟人类癌症差太大了,所以肯定得跟人类癌症数据比较,目前公共数据库里面以TCGA为最多。世界范围内,结直肠癌(colorectal cancer, CRC)是发病率第三、死亡率第二的恶性肿瘤,而在我国,结直肠癌是发病率和死亡率均排在第五位的恶性肿瘤,仅次于肺癌、胃癌、食道癌和肝癌,结直肠癌依据分子分型归为四类:微卫星不稳定(MSI)免疫型、经典型、代谢型和间质型。
这里有4组:
1) Human (Total) which including all of the 224 human CRC cases;
2) Human (MSS) which including 169 MSS cases;
3) Human (MSI) which including 64 MSI cases
4) AOM/DSS Mice which including the 14 cases
这样,对KEGG数据库里面的7个通路,就能看到小鼠模型跟人类癌症差异很大。作者的原话是:
Compared with those defined between human CRC groups (0.82, 0.84 and 0.46), the correlations between mouse model and human CRC (0.08, 0.07 and 0.07) are much lower, indicating that the patterns of somatic mutated genes were quite different in AOM/DSS mouse model and human CRC.
正文没有写这个相关性系数如何计算,不过在附件有提到,但是我仍然是看的不是很懂。
写在后面
虽然作者很艰辛的发表了他的博士研究成果,但是全文的证据链是有瑕疵的。
我大概打一个比方:
现在美国人里面有纽约和华盛顿人,他们跟中国人肯定是有差异的,该怎么样证明美国人跟中国人有差异呢
那就把美国人跟纽约和华盛顿人都比较,分析他们很一致
然后中国人跟美国人跟纽约和华盛顿人都差异很大
所以中国人跟美国人有差异。
我并不是想说,美国人跟中国人没有差异,我就是觉得,这样的证明不妥。
10月巡讲
1
10.12-10.14
2
10.26-10.28
课程内容 |
|
1 |
生信R语言入门 |
2 |
GEO数据库挖掘 |
5 |
生信-Linux基础 |
6 |
转录组课题设计与流程分析 |