人工智能比医生更会看病?别被炒作给骗了

 Jonathan Vanian 2020年04月28日

中文 双语
总要有医生来检查诊断结果,因此对比AI和人类医生的表现本身就是一件很荒诞的事。

一些学术论文提出,在解读肺癌、皮肤癌等疾病的医学影像时,人工智能(AI)比人类医生的能力更强。但近期的研究对该结论提出了质疑。

医学期刊《英国医学杂志》3月发表的一篇论文发现,许多相关研究言过其实,夸大了AI的实际效果。这一发现意义重大,原因是医疗行业正在寻求借助AI技术加快疾病诊断速度,而该发现动摇了行业变革的理论基础。

同时,科技行业也因热衷于开发和兜售用于医学影像分析的AI技术而备受质疑。该论文的作者担心,狂热的企业与投资者可能会在相关技术得到充分审查之前便会试图将其推向市场。

麦乌拉·纳杰德兰是这篇论文的合著者之一,他说:“我们并非不尊重风险资本家,他们在许多创新项目的融资过程中有着重要作用,但显然他们最关心的始终还是如何尽快将产品推向市场。虽然我们怀有同样的热情,但我们也非常清楚,要想大规模推广相关技术,必须首先确保其安全性和有效性。”

这篇论文还涉及了导致3万多美国人死亡的新冠疫情。有研究者声称,已开发出比人类更快的AI系统,来通过胸部CT扫描诊断病人是否感染了新冠病毒。

最近《英国医学杂志》回顾了近100项有关AI深度学习技术的研究,该技术已被应用到各种疾病的医学扫描中,包括黄斑变性、结核病和几种癌症。

最后发现,有77项研究在缺少随机试验的情况下比较了AI系统与人类医生的表现,并在其摘要或结语中给出了具体评价,其中,23项研究表示AI在诊断特定疾病时的表现比临床医生“更优秀”。

论文合著者、非盈利机构斯克利普斯研究所创始人兼董事埃里克·托普尔表示,这些研究的一个主要问题是“其中许多都有人为的痕迹”,相关研究人员只是在声称其技术的表现“比医生好”而已。他解释说,在现实生活中,AI和人类医生并不是非此即彼的关系。总要有医生来检查诊断结果,因此对比AI和人类医生的表现本身就是一件很荒诞的事。

托普尔说:“总有人很热衷于拿机器和医生来做比较,问题在于你不可能把解读医学影像的工作完全交给机器来做。如果真碰上威胁生命或者比较严重的疾病,还是得有医生来判断。”

他补充道:“我想说的是,如果你看了所有这些论文,你会发现其中多达90%的论文都是在进行人机比较,真的没必要这么做。”

英国国家健康研究所的临床医学研究员纳杰德兰表示,宣扬AI(相较于人类医生)的优势可能会对公众造成误导。

纳杰德兰说:“现在外面的炒作很多,这些炒作又通过媒体很快变成各种如‘AI即将取代医生’的传言流入患者耳中。”

他表示,除了进行人机比较这一核心谬误,这些论文最大的问题在于未能遵循医疗专业人士过去十年一直在努力打造的更为严格的报告标准。例如,这些论文一般都未使用多个数据集来衡量其深度学习模型的准确性,这就导致其研究对象十分有限,未能包括各种不同人群。

在查阅近期发表的一些关于使用深度学习技术通过胸部CT扫描诊断新冠肺炎的论文时,澳大利亚皇家阿德莱德医院医学影像研究室主任卢克·奥克登·雷纳也注意到了类似的问题。与《英国医学杂志》论文描述的那些问题多多的医学影像研究一样,新冠肺炎相关论文的结论也是建构在十分有限的数据之上,无法代表全体人群的实际情况,带有选择性偏差问题。

在其中一篇论文中奥克登·雷纳注意到,研究人员开发了一种深度学习系统,该系统能够基于从同济大学附属医院1014名患者处采集到的数据识别新冠病毒。这些患者均已通过传统拭子测试确诊患有新冠肺炎,并且也接受了胸部CT扫描确认其肺部是否已被感染。

也就是说,研究人员训练深度学习系统时用的可能是偏斜数据。医生很可能正是因为怀疑这些患者患有与新冠病毒相关的肺部疾病才让他们去做了胸部CT扫描。同样的技术在筛查无肺部感染症状的患者时可能就没什么用了。

奥克登·雷纳在发给《财富》的邮件中写道:“一般而言,数据集越准确、越全面,其用处也就越大。”

他认为,就新冠肺炎而言,现有检测手段已经十分有效,AI技术应该用于其它更重要的任务之上,研究者完全没有必要就使用深度学习技术诊断新冠肺炎发表论文。

奥克登·雷纳还在邮件中表示:“只靠CT扫描筛查新冠肺炎效果可能并不好。如果在现有医疗流程中有哪些瓶颈问题是AI可以解决的,那就需要专门收集与该问题相关的数据。”

托普尔同意奥克登·雷纳的观点,他表示:“在使用CT扫描判断肺部是否可能感染新冠病毒方面,算法是有用武之地的,但我们不一定要做CT扫描。”

托普尔解释说,随着传统检测工具全球供应量的增加,已然成为了比CT扫描更容易获得的检测手段,而且成本还更低。

托普尔表示,近期发表的这些AI医学影像研究给我们提了个醒,在评估自己的发现时,我们应当始终抱有怀疑精神。从本质上说,这些论文都是关于AI技术在当前医疗体系中潜在应用前景的初步研究,但研究者仍然需要开展更深入的临床试验,验证相关技术的有效性。

在初步研究之后,研究者通常会进行更为正式的学术研究,即前瞻性研究。托普尔表示:“研究者不能直接闷头去做前瞻性研究,也不应夸大自己的研究结论。”(财富中文网)

译者:梁宇

审校:夏林

(0)

相关推荐