麻省理工学院教授:医疗行业机器学习起步晚,未来将实现跨越式提高
今天,越来越多汇总数据集和数据分析工具,以及联邦法规对于信息的强制要求等,使机器学习已经成为现实。医疗机器学习具有巨大的潜力,能帮助临床医师、医生和研究人员从现有数据集中发现规律,从而提升医疗效率,改善医疗质量。机器学习大致可分为监督学习和无监督学习两种类型,它们各自在医疗领域都有不同的具体应用。
John Guttag是麻省理工学院教授,并担任计算机科学与人工智能实验室数据驱动推理研究小组的组长。该小组致力于高级计算技术在医学领域的应用研究,目前的项目包括预测不良医学事件、预测病患对治疗的具体反应、无创监测和诊断工具,以及远程医疗等。动脉网(微信:vcbeat)梳理了Guttag教授的观点,一起了解这两种机器学习类型对于医疗机构的意义,以及应用该项技术的必要条件。
Guttag认为,即使目前机器学习的影响力尚未对产业形成冲击,但其潜力是非常巨大的。在其基础阶段,机器学习涉及到从数据中查找那些不易看到的信息。例如:将机器学习应用于感染寨卡或其他病毒的患者数据中,从已经发生的事件中找出治疗的最佳方案,并将其用于未来的相关救治。
通常情况下,人们利用机器学习来构建推理工具。它可以帮助研究者从现有数据中发现规律,使其能够在新的数据呈现出来时,从数据中推断出一些有用的信息。与人类的直觉不同,机器学习完全是由数据驱动的。
下面让我们分别来了解监督学习和无监督学习对于医疗的重要性。
在监督型的机器学习中,数据和与数据相关的一些结局是已知的。以寨卡病毒为例,如果研究者拥有所有感染寨卡的患者信息,他们就能知道哪些产妇的小孩有先天缺陷。从中,研究者们便可以建立起一个模型,计算出感染寨卡产妇生下先天缺陷宝宝的可能性。当然,产妇的年龄也是影响宝宝健康的因素之一,但在机器学习的模型中,人们都会生成一个标签,标记产妇的各种细节和宝宝健康与否。所以,监督学习的特点就是将人们感兴趣的结局贴上标签。
另一方面,无监督学习则没有任何标签。在无监督学习中,研究者试图从刚刚得到的数据中推断出隐藏的结构。例如,初初拿到一堆医疗数据时,人们会发现患者们都很“相似”。通常来说,无监督学习的好处是人们能从中发现意想不到的信息。因此,在由于某种原因无法将数据标签化时,无监督学习便非常有用。
机器学习是当今计算机科学中发展最快的技术。由于近年来,医疗机构持续将研究重点倾向大数据分析、精准医学与人口健康,机器学习、人工智能和认知计算都将越来越有价值。
虽然IBM、谷歌、微软等科技巨头一直不断将其新技术推向市场,但在机器学习方面已经取得重大进展的则是金融服务、零售等行业,且该趋势已持续了大约10年。从这方面来说,总是对于新技术抱着观望态度的医疗行业,的确是起步太晚了。
医疗行业在新技术应用上面临诸多挑战,其中之一便是获取新技术与将新技术应用于医疗实践之间的巨大时间差。正因为如此,Guttag正致力于敦促主要医疗机构更积极地将机器学习融入现在的工作流程中。正如其所说,“人们应该用今天的技术来做今天的事情。机器学习是项了不起的技术,在未来几年一定会为医疗行业带来巨大的变化。”
Guttag和他的学生正与麻省总医院(MGH)密切合作,致力于将机器学习应用于临床工作流程,以降低医院感染。对于Guttag来说,医疗系统中的一个小小转变都比10篇纸上谈兵的论文更管用。他们在MGH的工作正在有条不紊地进行,并有望在1年内降低医院的院内感染率。Guttag希望在成功后,能将其做法移植推广到其他医疗组织。
当今的医疗机构有更多有效的信息收集技术,而联邦政府对于数据获取的强制规定也让医院不得不公开一些一度保密的数据,如感染率等。
临界质量是让机器学习可以用于实践的必要条件。例如,一家小医院无法深入利用其电子病历数据。以往,只有极少数医院有足够的数据来有效地部署机器学习。但是现在情况不同了。首先,医疗系统越来越壮大,独立医院很快将成为明日黄花。而伴随着医疗系统的增长,跨系统的汇总数据集也越来越多。
另一个必要条件是正确的专业知识。机器学习对于专业知识的要求很高,它不像其他较为成熟的技术,即使对专业知识一知半解也能进行傻瓜式操作。就目前的情况来看,计划部署机器学习的机构要么必须自身有扎实的专业知识,要么就花钱聘请专业技术顾问。当然,现在有些私人技术对于医院实施机器学习非常有用,也可以考虑购买。
许多公司宣称自己在机器学习领域有秘密武器。IBM的沃森是其最有创新力的一次创举,已经在医疗领域、金融领域和餐饮领域进行了尝试;谷歌除了拥有一些非常有价值的技术,还在公共领域发布了大量的工具。在未来,机器学习技术绝对会变得越来越好,并有望实现跨越式提高。
动脉网所刊载内容之知识产权为动脉网及/或相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。