太厉害了,利用TCGA数据发了12分的SCI
有的人利用TCGA数据发了1-2分的SCI;有的人利用TCGA数据发了3-5分的SCI;现在有人利用TCGA数据发了12的SCI。这篇文章发表在Nat Commun上,该期刊属于Nature子刊,影响因子:12.121,中科院分区:1区。文章作者分别来自于马萨诸塞州波士顿大学、杰克逊基因医学实验室、耶鲁大学医学院,文章出处:PMID: 33311458,DOI: 10.1038/s41467-020-20030-5。
研究背景:
组织病理学图像普遍用于研究癌症但尚未完全探索数据的类型。手动检查非常耗时,因此很难用于图像数据挖掘。在这里,我们表明卷积神经网络(CNN)可以系统地应用于各种癌症类型,从而能够进行比较以揭示共享的空间行为。
研究方法和结果:
我们开发了CNN架构,以分析来自癌症基因组图谱(TCGA数据库)的27,815苏木精和曙红扫描图像的肿瘤/正常,癌症亚型和突变分类。我们的CNN能够对TCGA病理学家注释的19种完整幻灯片图像(WSIs)的肿瘤/正常状态进行分类,并且AUC一致性较高(0.995 ± 0.008),虽然肿瘤亚型较低但也具有明显的准确性(AUC 0.87 ± 0.1)。值得注意的是,在一种组织上训练的肿瘤/正常CNN在其他组织上有效(AUC 0.88±0.11),并且分类器关系也概括了已知的腺癌,癌和发育生物学。此外,分类器比较揭示了幻灯片内的空间相似性,分类器对之间的平均图块级相关性为0.45±0.16。乳腺癌,膀胱癌和子宫癌的空间分布特别容易检测,表明这些癌症可能是图像分析的典型类型。还可以检测到TP53突变的模式,WSI自组织和交叉组织AUC的范围为0.65-0.80。最后,我们用病理学家标注的核对170个乳腺癌和结肠癌图像上的CNN进行了比较评估,发现细胞和细胞间区域都有助于CNN准确性。
研究结论:
这些结果表明,CNN不仅对组织病理学分类具有强大的功能,而且还具有交叉比较的能力,可以揭示整个肿瘤的保守空间行为。
分析内容:
1、进行适用于肿瘤/正常组织的泛癌卷积神经网络分类
2、进行癌症亚型的神经网络分类
3、分析肿瘤类型之间的交叉分类的保守的空间行为,交叉分类关系概括了癌症组织生物学
4、使用CPTAC图像验证交叉分类关系
5、进行TP53突变分类的神经网络比较
6、分析影响肿瘤纯度预测的特征
这类TCGA数据挖掘的特点往往如下:
1、分析方法高大上
2.数据难以获取,普通人根本获取不了,样本量巨大(大于1万)
3.需要强大的计算机资源(普通个人电脑根本完成不了)
4.需要雄厚的生信专业知识和计算机知识
5.需要有实力的团队来完成,个人无法实现
6.科研经费充足