肿瘤相关基因组检测公共数据库介绍: MSKCC

之前在一篇NC的文献(如何利用公共数据发NC)当中,提到过一个公开的测序数据(MSK-IMPACT)。所以今天就来简单的介绍一下这个数据集。这样,在进行公共数据挖掘的时候,除了TCGA。同时也可以考虑用有这个数据集来增加分析的内容

关于MSK-IMPACT

通过二代测序的高通量检测方法,我们可以一次性检测一个人很多基因的基因组的变化。MSK-IMPACTTM是一种基于NGS panel的杂交捕获技术,可快速检测与癌症相关的468个基因上的所有蛋白质编码突变、拷贝数变异、启动子突变以及结构重排的信息。不同于常规检测,MSK-IMPACTTM适用于任何肿瘤类型。

如果只是说,这个测序技术可以来对患者进行基因组信息检测的话,其实对于我们科研而言也没有什么用。关键的是,纪念斯隆·凯特琳癌症研究中心(Memorial Sloan Kettering Cancer Center,简称MSK)把他们之前对于患者检测的10000多个样本都共享出来了,供研究者进行数据挖掘。这样就方便我们使用了。这个数据都保存在cBioPortal网站上(https://www.cbioportal.org/study/summary?id=msk_impact_2017)

另外,关于cBioPotral的使用,这个我们之前介绍过,这个有兴趣的可以看一下,我们第二个帖子

MSKCC数据集使用简单介绍

关于这个数据集,我们需要注意的是,虽然虽然这个是一个泛肿瘤的数据集。我们可以在里面应该能绝大多数的肿瘤。另外关于患者的临床信息,里面也包括了随访以及用药情况。这个对于用药情况的记录会比TCGA要好一些的。

但是需要注意的是,由于MSKCC做的还是基因组的测序。所以我们通过这个数据集能够获得的也就是各个患者DNA水平上的变化情况。基于DNA水平的变化,基本上常用的就是突变、拷贝数以及融合基因这类的。所以,如果想要观察这个患者mRNA基因表达的变化是不能使用了。

另外,由于这个项目做的是定向监测几种肿瘤相关基因的检测。所以这个有可能想要研究的罕见基因,不包括在这个数据集当中。这个也是需要注意的。

所以综上,这个数据集更可能用于,在进行基因组数据挖掘(突变,拷贝数等)时候,在进行了全基因组的观察之后,如果想要进一步观察临床用药患者对于某些基因突变的变化

(0)

相关推荐