《自然》:AI与癌症诊断的又一次完美结合!哈佛科学家用AI读取癌症患者的病理切片,实现对原发灶不明癌...
如果说近年来最热门的新兴技术有哪些,人工智能(AI)一定榜上有名。
“万物皆可AI”这句笑言便是其热度最好的体现。
AI的进步推动了各个行业的发展,通过将AI图像识别技术和医学影像资料相结合,在多个医学影像读片或诊断任务中,AI已经能够达到甚至超越专业医生的水平[1,2]。
近日,来自哈佛大学Faisal Mahmood教授课题组的研究者又一次实现了AI与癌症诊疗的完美结合。
通过训练一个卷积神经网络(CNN)模型,研究者仅依靠读取患者的病理切片,便能实现对原发灶不明癌症的溯源。相关工作发表于《自然》杂志上[3]。
如果这项研究成果投入临床使用,那意味着,仅需一张普通的病理切片,医生就能圈定原发灶不明癌症的范围,这必定会大幅减轻肿瘤科医生的工作难度,也减轻患者的经济负担。
论文截图
原发灶不明癌症(CUP)是一类“经过详细的检查,但始终无法确认癌症原发灶”的转移性癌症的统称,在所有癌症患者中占比1%-2%。这类患者往往会经历各种各样的检查,但最终只能依据经验联合使用放化疗,经济负担很重但普遍预后较差,中位生存时间仅为2.7-16个月[4,5]。
近年来,有研究者利用基因组学技术寻找CUP的起源[6]。但其表现并没有完全令人满意,同时,基因组学检测对于CUP患者来说也是一项不小的经济负担。
既然始终没有寻找CUP来源的完美手段,那么我们能否依据现有的检查结果来预测肿瘤的来源呢?
这就轮到AI来大显身手了。
图像识别任务向来是AI的拿手好戏,本文的研究者通过学习大量患者的苏木精伊红染色(H&E)病理切片,以弱监督的方式训练出一个CNN模型(命名为TOAD)。在读取一张病理切片后,TOAD能够对人体的18种组织进行预测打分,通过对预测分数进行排序,以找到癌症最可能的组织来源。
文中需要的病理切片及CNN网络模型示意图
注:为了方便描述,我们把预测结果中排名前k个组织来源包含正确来源的概率称为Top-k准确率。如预测结果中排名第一的组织来源就是正确来源的概率称为Top-1准确率,预测结果中排名前三的组织来源包含正确来源的概率称为Top-3准确率。
作者从公共数据库和百翰妇女医院中收集了来自29107名患者的32537 张H&E染色切片,分别标记为18种原发癌源。按照70%,10%,20%的比例划分为训练,验证和测试数据。
通过反复的训练和优化模型,TOAD在测试数据中的Top-1准确率为83.4%,Top-3准确率为95.5%,而Top-5准确率已经能够达到98.1%。
整体研究设计示意图
为了探究TOAD是否具有普适性,研究者又从223家医学中心收集了682名患者的数据进行预测。在这些数据中,TOAD的Top-1准确率为79.9%,Top-3准确率为93.4%,表现依然十分出色。
然而,我们的目标是预测原发灶不明癌症的起源。但对于那些始终没有找到原发灶的患者,我们就算预测出来源也无法判断来源是否正确。因此,研究者决定选择一些诊断困难的患者数据进行预测。
研究者采用“是否通过免疫组化(IHC)进行诊断”来定义诊断难度。对于那些不需要IHC就能完成诊断的患者,TOAD的Top-1准确率为87.4%,Top-3准确率为96.7%。而对于那些需要三次或以上IHC才能完成诊断的患者,TOAD的Top-1准确率为75.7%,Top-3准确率为92.0%,表明就算是那些诊断困难的癌症患者,AI依然能够很好的完成预测。
进一步的,研究者又从152家医学中心收集了743名患者的数据,这些患者均在诊疗过程中的某一个时段被诊断为CUP,其中的317名患者经历彻底的临床和辅助检查之后,最终确定了肿瘤来源。研究者选择这317名患者的切片进行原发灶预测。
Cup任务示意图
面对这样困难的任务,仅仅依靠读取病理切片数据,TOAD能做到什么程度呢?
结果是令人欣喜的。
虽然TOAD对于这些数据的Top-1准确率下降到了60.6%,但是Top-5准确率仍能达到92.1%。这说明即使是面对临床中最难诊断的CUP患者,TOAD仅仅通过读取病理切片,便能很好的缩小癌症的可能来源。
总体来说,TOAD能够成为肿瘤科医生非常好的辅助工具。在资源有限地区,TOAD能够为普通癌症患者提供很好的诊断参考,而不需进行额外的检查。对于那些诊断困难的癌症患者,TOAD也能极大的缩小诊断范围。
更重要的是,有了TOAD进行参考,我们在转移灶溯源时也不会像之前一样仅凭经验和运气,这势必将使我们的诊疗策略更具目的性,更高效的完成诊疗。而我们都知道,在肿瘤治疗中,时间就是生命。
如今,AI与医疗结合的愈来愈紧密。未来AI是否能帮助解决更多的医疗难题呢?就让我们拭目以待。
参考文献:
[1] Aminian A, Zajichek A, Arterburn DE, Wolski KE, Brethauer SA, Schauer PR, Kattan MW, Nissen SE. Association of Metabolic Surgery With Major Adverse Cardiovascular Outcomes in Patients With Type 2 Diabetes and Obesity. JAMA. 2019 Oct 1;322(13):1271-1282. doi: 10.1001/jama.2019.14231. PMID: 31475297; PMCID: PMC6724187.
[2] Campanella G, Hanna MG, Geneslaw L, Miraflor A, Werneck Krauss Silva V, Busam KJ, Brogi E, Reuter VE, Klimstra DS, Fuchs TJ. Clinical-grade computational pathology using weakly supervised deep learning on whole slide images. Nat Med. 2019 Aug;25(8):1301-1309. doi: 10.1038/s41591-019-0508-1. Epub 2019 Jul 15. PMID: 31308507; PMCID: PMC7418463.
[3] Lu MY, Chen TY, Williamson DFK, Zhao M, Shady M, Lipkova J, Mahmood F. AI-based pathology predicts origins for cancers of unknown primary. Nature. 2021 May 5. doi: 10.1038/s41586-021-03512-4. Epub ahead of print. PMID: 33953404.
[4] Rassy E, Pavlidis N. Progress in refining the clinical management of cancer of unknown primary in the molecular era. Nat Rev Clin Oncol. 2020 Sep;17(9):541-554. doi: 10.1038/s41571-020-0359-1. Epub 2020 Apr 29. PMID: 32350398.
[5] Varadhachary GR, Raber MN. Cancer of unknown primary site. N Engl J Med. 2014 Aug 21;371(8):757-65. doi: 10.1056/NEJMra1303917. PMID: 25140961.
[6] Penson A, Camacho N, Zheng Y, Varghese AM, Al-Ahmadie H, Razavi P, Chandarlapaty S, Vallejo CE, Vakiani E, Gilewski T, Rosenberg JE, Shady M, Tsui DWY, Reales DN, Abeshouse A, Syed A, Zehir A, Schultz N, Ladanyi M, Solit DB, Klimstra DS, Hyman DM, Taylor BS, Berger MF. Development of Genome-Derived Tumor Type Prediction to Inform Clinical Cancer Care. JAMA Oncol. 2020 Jan 1;6(1):84-91. doi: 10.1001/jamaoncol.2019.3985. PMID: 31725847; PMCID: PMC6865333.
责任编辑丨BioTalker