在未来,AI 负责给你看病,而医生负责的是……

汪诘 科学声音 2020-12-04

第 8 期

当我把视角放得越大、越宏观,我就会看到越多确定性的趋势,在医疗这个领域也不例外。

——汪诘

微信公号:科学有故事

这一篇是未来科技体验馆第二季的最后一期,我要来谈一个人人都会关心的大话题:未来医疗

但医疗这个话题实在太大,而篇幅有限,因此,我不会纠结在具体的细节中,比如癌症什么时候能彻底攻克,阿尔茨海默症的特效药能不能研发出来等等。我们今天要来谈的是未来医疗的大趋势和大方向。这么多期畅想未来的文稿写下来,我有个体会,当我把视角放得越大、越宏观,我就会看到越多确定性的趋势,在医疗这个领域也不例外。

在我们大多数人的印象中,医学是一门非常古老的学科。无论是代表东方传统医学的《黄帝内经》,还是代表西方传统医学的希波克拉底先生,距今都有超过 2000 年的历史。因此很多人会认为,医学已经是一个发展得相对成熟的学科,尤其是医学的底层理念应该已经较为成熟了。

然而,真相却并不是大多数普通人以为的那样。就在 20 多年前,距离维萨留斯创立近代解剖学的 400 多年后,一个现代医学的新理念开始席卷全球医学界,无数医生在接受了这个新理念后,都像是经历了一次脱胎换骨般的重生。它使得现代医学的核心理念开始发生革命性的巨变,我们今天依然处在这个巨变中。这就是被称为“21 世纪临床医学新思维”的——循证医学(Evidence-Based Medicine,EBM)

有一位我相当敬佩的网红医生余向东医生,网名棒棒医生,他自述的亲身经历最能体现循证医学对他这一代医生的观念冲击有多大。

在《棒棒医生成长记 9/我和循证医学》[1]这篇日记体的文章中,棒棒医生这么写道:

我自 1986 年进上海医科大学,受国内最高等的医学教育 6 年;毕业后在三甲医院从事临床 12 年(到 2004 年),长达 18 年时间里,我对“循证医学”四个字闻所未闻,可谓“痴”之极矣。2005 年左右,我在网上第一次了解了循证医学后,一见即钟情,一见即皈依,从此再也没有改变过,也再也没有动摇过。

在上面这段话中,我请大家特别留意棒棒医生提到的时间。棒棒医生作为目前国内推广循证医学理念的主要人物之一,他也不过是在 2005 年才第一次听说循证医学,可见这个概念有多新。我相信,看我今天这篇文章的读者中,一定也会有很多经验丰富的资深医生,但是第一次听到这个概念。我觉得这一点儿也不奇怪,您不妨留言告诉我,这反而能证明您的虚心好学。

如果我们简单回顾历史就会发现,循证医学的概念的确相当新。上世纪九十年代初,循证医学这个词才开始陆续出现在加拿大的医学系统中,随后迅速传播到美国、英国等西方发达国家的医学系统中[2]。1996 年,华西医院的刘鸣教授从英国留学归国,带回了这个新概念。第二年,即 1997 年 2 月,在时任医院科研副院长的李幼平教授的牵头下,中国循证医学中心在华西医院成立[3],这标志着我国的医学界正式拥抱“循证医学”这一医学新思维。

不过,从成立学术机构到向高等教育普及,那还要经历漫长的教材编写、审核、培养讲师等等复杂的环节,所以,连棒棒医生这样特别好学的医生直到 2005 年才第一次听说“循证医学”,也就不足为奇了。

那么循证医学到底是什么?为什么会有如此强大的魅力,让众多的医生一见钟情、终生不悔呢?我希望,通过下面对循证医学的阐述让你感受到:未来医疗之路已经在迷雾中清晰地显现出来,我们已经在路上。

什么是医学证据?

假如对“循证医学”这四个字望文生义,很容易让人以为是这样:通过适当的检查,使医生的诊断和治疗方案建立在“证据”的基础上。听上去似乎是一句绝对正确的废话,难道还有医生没有依据就乱开方子吗?

当然没有那么简单,“循证医学”的核心在于对医学证据的再认识。

不同时代的医生,在给病人开出治疗方案时,都讲证据。中医的证据就是经典著作,比如《黄帝内经》《难经》《伤寒杂病论》《神农本草经》等中医经典著作,以及流传下来的权威语录,还有大量的古代医案笔记等等。一个合格的中医在开方子的时候,必须要引经据典,头头是道,否则会被同行看不起。

循证医学之前的现代医学,在给病人治病时,当然也讲究证据,它的证据是基础医学的科学实验结论,如生理学、药理学、病理学等等,还有临床流行病学的证据。说得更实际一点,过去,一个西医做决策,一般来说,首先依据他过去学习过的教科书或者临床指南,如果现有文献上没有明确答案,就会找上级医生求教。

但是,这里有一个关键问题,就是当证据与证据之间出现矛盾时,该怎么办呢?在循证医学出现之前,医生往往是依靠自己的经验做一个决策。不同的医生积累的经验不同,对待同一个情况,就有可能做出不同的决策。这也是为什么病人往往更愿意信任年龄更大的医生,因为人们往往认为医生从医时间越长,经验就越丰富,遇到的疑难杂症也越多,自然也就越有可能做出正确的决策。但真的是这样吗?

这时候,“循证医学”发出了一句振聋发聩的宣言:

并不是所有证据都生而平等,医学证据有高下之分。

这就是循证医学的第一原则,同样是证据,有一些证据就是比另一些证据更大。那么问题来了,循证医学到底是如何给证据划分高下等级的呢?

在解释较为枯燥的概念之前,让我先给你讲一个你可能听说过的医学史故事,但很可能,你并不知道这个故事的真正结局,它会让你大吃一惊。

洋地黄走下神坛的故事

1785 年,有一个叫威廉·维瑟林(William Withering)的英国医生听说,有一位乡村老妈妈手里有一个很神奇的偏方,可以治疗一种很常见但当时无药可治的疑难病。

这种疾病,大约每 100 个成年人中就有 1 个会得,而且年龄越大,发病率越高。这种病的典型症状是:下肢(往往是脚部)有水肿的现象,走路稍快或者轻微劳动后就会气喘吁吁,晚上睡觉的时候要把枕头垫得很高才能呼吸顺畅。今天我们知道,这种疾病就是心力衰竭(心衰)。它是因为各种心脏疾病导致心脏泵血不足而产生的临床症状。

维瑟林医生听说,赫顿妈妈手中的药有奇效,病人吃下去以后,很快脚不肿,气不喘,干活特利索。于是,维瑟林医生就找到了那位乡村农妇,并且花钱从她手中买下了这个偏方。这个偏方中包含了大约 20 种不同的植物,维瑟林医生把这个偏方给他的病人服用,果然有奇效。维瑟林是一位经验丰富的职业医生,他估计真正起效果的应该是其中的某一种植物,他要把这种真正起效的植物给找出来。

经过 9 年的研究,维瑟林终于把这个偏方给研究透了,他找到了其中的有效成分,就是后来名扬天下的——洋地黄,一种会开出红色或者白色小花的高大的草本植物。从此,治疗心衰,全世界进入到了“洋地黄时代”。一种从洋地黄中提取出有效成分的常见药物也应运而生——“地高辛(Digoxin)”。

这之后的 200 多年中,洋地黄一直稳居心衰治疗的头把交椅。在临床上,洋地黄类药物对于缓解慢性心衰的症状有非常明显的效果,甚至应用扩展到了心律不齐、心房颤动和扑动等疾病。200 多年下来,无数真实案例都是实实在在的,医德崇高的医生们必定愿意用人格来担保这些病例的真实性,他们的经验在无数面病人赠送的锦旗中得到了一次又一次的加强。

然而,到了 1997 年,美国一项针对洋地黄类药物地高辛的大型随机双盲对照实验的结果却让医学界大吃一惊。6000 多名病人被随机分成两组,分配到地高辛治疗组的病人总死亡率为 34.8%,而安慰剂组的总死亡率为 35.1%,只相差 0.3%,不具备统计学意义上的显著差异。换句话说,地高辛只能略微减少住院率,但是并不能降低死亡率。论文于 1997 年 2 月发表在全世界知名的医学期刊《新英格兰医学杂志》上[4](后面我用 DIG 试验来指代这次试验)。DIG 试验可谓是一石激起千层浪,无数的医生不敢相信这样的结果,一向被他们奉为心衰神药的洋地黄,在大样本随机双盲对照试验下露出了原形,它居然仅仅起到了略微减少住院率的作用,换句话说,病人好转不过是回光返照般的假象而已。

这个故事到这里还没完,还有更加惊人的真相在等待着已经瞠目结舌的医生们。对洋地黄的研究当然没有到此为止,1997 年之后,全世界有大量的医学研究机构扎了进去。所有的研究结果都一次次地冲击着医生们的传统观念。越来越多的证据表明,地高辛不仅不能降低死亡率,反而会增加病人的死亡风险。比如:

1999 年3 月9 日,《美国心脏协会期刊》发表论文[5],结论是患者血液中地高辛含量越高,死亡率越高。

2017 年3 月 19 日,《美国心脏协会》发表论文[6],结论是服用地高辛的心室颤动患者,无论是否患有心力衰竭,与没有服用该药物的患者相比,死亡风险增加,而且这种风险随着血液中地高辛含量的增加而增加。

2019 年,来自欧洲的一组科学家重新分析了 1997 年那次著名的 DIG 试验的所有原始数据。之所以要重新分析,是因为有些科学家怀疑 DIG 试验的结论没有排除“处方偏见”,即医生在治疗时倾向于给病情恶化的病人开出额外的药物。研究结论是,排除掉“处方偏见”的干扰后,原始结论依然是成立的。论文发表在同年 6 月份的《欧洲心脏杂志》上[7]。

就这样,洋地黄被无情的大样本随机双盲对照试验数据拉下了神坛,无数的“真实案例”,无数医生的毕生经验都被证明错了。洋地黄不仅不是治疗心衰的神药,反而是加速病人死亡的毒药。但遗憾的是,如果你在网上搜索洋地黄,对它最多的介绍依然是治疗心衰的特效药。

现实有时候就是这样魔幻和残酷。

循证医学的证据金字塔

类似洋地黄这样的医学史上的故事还有很多很多,它们一再地告诉医生们这样一个事实:医生的个人经验和大量的真实案例都不是最佳的医学证据,它们都有可能与病人的生命健康南辕北辙。

在所有可以被称为医学证据的证据中,只有“随机双盲对照试验 Randomized controlled trial”(英文简称为 RCT)的试验结果才是证明效力最高的证据。

好了,到这里我就可以给你讲解循证医学的核心概念:证据金字塔。理解了证据金字塔,我们对循证医学就有了一个总体印象,足够你理解我后面要谈的未来医疗的大趋势了。

在循证医学中,把所有的医学证据按照证明效力从高到低分成了五级:

1

在收集了所有高质量大样本 RCT 结果后作出的综合荟萃分析

循证医学的思想就是告诉医生们:

在面对某项医疗决策时,假如你能查得到第一级证据,那么,什么也别多想了,不管这个证据和你的经验是否相符,也不管它是否和你在教科书上学到的有没有矛盾——第一级证据最大,作为信奉循证医学的医生,你必须抛弃个人的执念,按照第一级证据给出的结论来做决策。

用一句更通俗的话来说,循证医学就是告诉医生们:没有什么是必须遵守的“真理”和“常识”,一切理论、经验、常识都可以被 RCT 证据,也就是大样本随机双盲对照试验的证据所颠覆。

讲到这里,我给你们先埋下一个小小的思考:想想看,排除人为经验干扰的最佳方式是什么?

2

单个大样本 RCT 的结果

这个好理解对吧,没有很多不同科研机构的重复试验,哪怕只有一次高质量的 RCT 试验也行,也依然是高质量的证据。

3

有对照但未用随机方法分组的研究

4

无对照的系列病例观察

说通俗点儿就是真实发生的病例个案,不论有多少个这样的病例,都只能算作第四级证据。

5

专家意见、描述性研究、病例报告

这一级证据说通俗点儿其实就是医生的个人经验。它是证据金字塔中证明效力最低的证据。

以上这五级就是循证医学的核心思想,也是 21 世纪的医学看待医学证据的新思维。在这里我还需要特别强调的一点是:

循证医学认为,只有第一级和第二级证据,也就是 RCT 证据才是可靠的证据。而第四级和第五级,也就是个案和医生经验被认为是不可靠的证据,只有在确实没有前三级证据的情况下,说得不好听点儿就是只有在死马当活马医的情况下,医生才能根据经验来治病。

医学发展日新月异,棒棒医生的观点是:事实上,更多的情况不是没有证据,而是医生不会找证据和学习不足[8]。

在我看来,这的确是一个残酷的事实。根据美国国家科学基金会的统计[9],2018 年一年,经同行评议正式发表的医学和生命科学领域的论文大约有 93.6 万篇,相当于每天 2500 多篇。即便是一个特别细分的医学领域,也需要一个医生保持旺盛的学习力,养成随时查询文献的习惯,才有可能跟得上时代。更残酷的是,大多数高质量的医学论文都是用英文写的,想要当一名好医生,英文不好也会很吃亏。

因此,从循证医学的角度来看,和大多数人的直觉相悖的是,医生可不是越老越可信。

未来医疗大趋势

到这里,我不知道你们是否可以认同我的一个观点:

按照循证医学的理念,最优的医疗施治方案并不依赖于医生的经验,而是可以从当前人类所有医学证据中求出的一组数学解。

假如这个观点是正确的,循证医学的精髓又要求医生丢掉自己的经验和直觉,那么最好的方法就变成了:把医疗决策交给机器,也就是 AI

当然,这需要一个前提条件:绝大多数疾病的治疗方案都已经有了 RCT 证据。显然,我们现在还远远没有达成这个前提。

但是,人类所面临的疾病总数是大致恒定的。你或许会想,今年的新冠肺炎不就是新出现的疾病吗?没错,是会有新的疾病冒出来,但这对于人类已知的疾病总数来说,增量是极少的。而且,具体的某种病毒会有新冒出来的,但它逃不掉人类认知的大框架,我们已经掌握的免疫学和病毒学知识完全可以应用在这种新型肺炎上。可以说,医学发展到今天,已经不再有什么人类完全未知的疾病了,有的只是尚未攻克的疾病。我们每攻克一种疾病,人类的疾病清单中就会被勾掉一个,就好像我们勾掉天花、阑尾炎一样。每勾掉一个,清单就会减少一分。

因为医生只有在没有 RCT 证据的领域才有发挥的空间,所以,随着 RCT 证据数据库的日益丰富,未来的医生就会逐步把解决方案交给 AI 决策,人类的大脑在检索数据库方面无论如何都不是 AI 的对手。这就是未来医疗的大趋势、大方向,它是自然选择的结果。不认同循证医学思想的医生最终都会老去,在循证医学熏陶下的年轻一代会一茬一茬地成长起来,最终成为医生的主流。

那么,这是不是意味着医生都将失业了呢?

我认为不会,即便是所有的疾病都有了 RCT 证据,有一项工作还是必须由真人医生来完成,那就是对病人的心理关怀,也包括对病人的临终关怀。医生还有一项重要的工作,就是帮助病人或者家属做出两难的抉择。只要人性没有丧失,我很难想象一个人愿意把自己的身体完全交给机器来处理。

绝大多数的 RCT 证据都不是一个确定的结果,往往都是用概率来体现的。因此,未来的医疗 AI 很可能并不会给出一个最终的医疗决策,而是给出众多不同解决方案的有效率和风险对比。

举个例子:

某一天,老王因为胃不舒服去医院看病,在完成了所有必要的检查后,老王被确诊为胃癌早期。医疗 AI 以老王的年龄、既往病史、基因测序结果等作为基本参数,在全球医疗云数据库中进行比对分析后,给出了如下治疗方案:

  1. 采用重离子放射性治疗,五年存活概率 80%,但会增加 10% 的直肠癌风险;

  2. 免疫疗法,五年存活概率 70%,但会额外增加 15%  的免疫系统疾病风险;

  3. 手术疗法,五年存活概率 90%,但有 20% 的风险引发其他并发症;

  4. 纯天然疗法,改变生活方式,配合一些药物,五年存活概率 60%,但没有任何特别显著的风险。

这个例子只是我假想出来的一个高度抽象和简化的例子,未来真实的治疗方案肯定不会像我说的这么简单。但从本质上来说,AI 给出的不同治疗方案并没有绝对的优劣之分,只是不同可能性的一种组合,还是需要病人自己来作出最终决策。

老王在拿到医疗 AI 给出的建议书后,免不了非常焦虑,不知所措。这时候,老王的主治医生李大夫就会非常耐心地给老王解释每一种治疗方案的具体实施过程,治疗过程的痛苦程度,以及对未来生活质量的影响等等。李大夫还会跟老王讲其他病人的故事,以及其他病人在面对这种关键决策时所考虑的因素等等。

在李大夫的关怀下,老王结合自己的情况做出了权衡,最终选择了一种治疗方案或者治疗方案的组合。

像这样的就医体验和医患关系,会逐渐成为未来医疗的大趋势。

未来科技

体验馆

听到这里,你可能想问我:这样的未来何时会到来,有没有一个“技术奇点”让这个未来突然加速到来。

在进行了认真的思考之后,我觉得医疗的变革只能是一个渐进的过程,因为影响医疗系统的不仅仅是医学的进展,技术的进步,更加重要的是病人和医生观念的更新。另外,医疗体制、意识形态、基本国情等等因素也会直接或者间接影响着未来医疗的发展。所以,未来的医疗肯定不会让你在短短数年内感受到巨变,但如果我们以每十年为一个节点,就一定能感受到我所说的这种趋势变化。

在未来医疗这个领域,并没有某一个标志性的技术奇点。但如果我们把不同的细分领域拆开来看,还是能看到很多奇点临近的领域。

比如影像医学领域。各种医学影像,像 X 光片,B 超图像,CT 扫描图像,核磁共振图像等,都不再需要医生用肉眼来判定结果,全部改由 AI 来识别。

2019 年 9 月 25 日,顶级医学期刊《柳叶刀》旗下的《柳叶刀数字健康》发表了一项研究[10],研究者对 2012 至 2019 年间公开发表的科学文献做了综合荟萃分析,比较 AI 和医生在医学影像诊断上的优劣。在其中的 14 项研究中,AI 与医生的表现已经旗鼓相当。最终的疾病判定当然不只是依靠影像学,毕竟任何临床指标在 AI 面前都是数字而已,没有科室成见。但在影像医学这个细分领域,技术奇点已经临近。

另外,以 PCR、NGS、质谱等技术平台为代表的分子检测技术发展得非常迅速,人工智能的早期应用也越来越成熟,临床意义甚至比影像医学更大。

我充分相信,用不了多少年,基于“电子病历Electronic Medical Records ”(EMRs)、大数据和人工智能形成的临床方案体系,在科学性方面就会对人类医生的经验判断形成碾压式的超越。像这样的变化,在许多领域都在悄然发生着。不管我们愿意不愿意,我们都必须接受这样一个事实:

医疗方案的筛选,本质上就是一种大数据分析算法,最终的结论就是以概率描述的一组数学解。每一个病人从以往全体病人的医疗数据中找到最适合自己的解决方案,而这次治疗结果又将成为医疗大数据中的一部分,影响今后的解决方案。如此循环往复,就构成了未来医疗的全景图。我们每一个人的肉体最终都会消失,但我们的医疗数据却会在云中永生,为后世的人类健康做出贡献。

伦理与技术

本期关于未来医疗的话题就讲到这里,这也是《未来科技体验馆》第二季的最后一期。在这个系列即将结束之际,我还想谈一些我对未来科技发展的总体思考,给这个系列划上一个总的句号。

自人类从农业社会进入到工业社会后,现代科学的诞生在短短的三四百年间,使得我们的生活方式发生了翻天覆地的巨变,人与大自然的关系也发生了巨变。但与生活方式的巨变形成鲜明对比的是,我们每一个人的身体和基因其实和几万年前的智人并没有什么本质的差异。基因的演化速度远远跟不上生活方式和生活环境的变化速度。

人类的科技发展有一个并非来自科学技术本身的奇点,这个奇点其实就是写在我们人类基因中的底层逻辑。因为人类是一种有感情的动物,我们有爱恨情仇,我们有忧思恐怒。这就必然让人类自发产生“科技伦理”。请注意,我在这里完全没有否定科技伦理的意思,我完全赞同科技的发展要受伦理的制约。我只是提醒大家注意,科技伦理并不是天然存在于宇宙中的自然法则,它本质上是人类基因的某种表现形式。

说得更加通俗一点:假如这个宇宙中有无数个文明,那么,每个文明的“科技伦理”必然不同。在人类看来绝对应该禁止的技术,在某个外星文明看来,很可能就是天经地义的事情。从全宇宙的宏观视角来看,形形色色的“科技伦理”决定了每个文明的科技发展方向及结果。

假如未来某一天,我们现在认为必须恪守的某些科技伦理发生了改变,未来人诞生了新的科技伦理,那么,有些领域的技术必然会得到井喷式的发展。无论你对这种改变充满忧虑还是充满期待,都无法改变一个事实:

未来人的思想是自由的,而我们终将作古。

感谢您的陪伴,未来科技体验馆第二季到这里就全部结束了。

未来科技

体验馆

最后这期的彩蛋是:

提问

你想知道 IBM 著名的医疗 AI 沃森从名噪一时到麻烦缠身的故事吗?

如果你对此有兴趣,我会在“未来小课堂”继续为你讲解,正文的精华内容后续还会以漫画的形式整合上线。请在微信搜索公众号“浦发银行”,关注并私信回复关键词“未来科技体验馆”便可进入彩蛋听我讲解!

扫描二维码

获取更多精彩

浦发银行

信源

[1]https://mp.weixin.qq.com/s/5B_jt0ZoNrBk0XWlTM0ZTA

[2]https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3263217/

[3]《循证医学在中国的起源与发展:献给中国循证医学20周年》(李幼平等 Chin JEvid-based Med 2016,16(1);2-6)

[4]https://www.nejm.org/doi/full/10.1056/NEJM199702203360801

[5]https://www.ahajournals.org/doi/full/10.1161/01.cir.99.9.1265

[6]https://www.acc.org/latest-in-cardiology/articles/2017/03/13/17/58/sun-1045-am-aristotle-digoxin-and-mortality-in-afib-patients-with-and-without-hf-acc-2017

[7]https://academic.oup.com/eurheartj/article/40/40/3336/5520008

[8]https://mp.weixin.qq.com/s/aJJjTwLRkQaa0eK6oImpyw

[9]https://ncses.nsf.gov/pubs/nsb20206/

[10]https://www.thelancet.com/journals/landig/article/PIIS2589-7500(19)30123-2/fulltext

(0)

相关推荐