计算医学白皮书发布,数据和计算正在加速改变医学

随着数据的飞速积累和方法加速更新换代,未来医学范式将向以数据和计算方法为主的计算医学(Computational Medicine,CM)发生转变。通过计算模型和超算技术,这种新的医学范式以逼近真实的方式理解生命机理和疾病机制,并将提高疾病预测、临床诊疗和健康维护水平,使个性化决策成为可能,从而可能彻底改变从单个病人护理到政策制定的整个医学领域。

近日,浙江数字医疗卫生技术研究院、浙江树人大学和动脉网联合发布了《计算医学:数智时代的医学发展新范式》白皮书。白皮书认为,计算医学正在加速改变整个医学领域。

为方便阅读,本文对白皮书做了不改变原意的删减。如需下载白皮书原文,请至文末扫码下载。

计算医学是如何兴起的?

医学实践具有相当大的不确定性,且一直存在。传统医学面对这些决策中的不确定性,通常的处理方式是通过从经验中积累的专业知识进行判断,后发展为通过循证医学的形式对研究进行系统的评估实现。然而,循证医学主要以群体证据作为核心依据,往往无法有效的解释个体差异。
随着基因测序、检查检验设备、可穿戴设备等新的检测方法和检测工具的不断涌现,获取个人不同尺度上的健康、疾病数据成为可能。这也导致医疗健康相关的数据指数级增长。同时,大数据赋予了医生和临床科研人员更多、更细致的维度去了解疾病发生发展过程,大大拓展了医学研究的深度和广度。
这些复杂数据的处理已经远远超出个人的处理能力,急需新的方式与手段帮助医生从多维、立体、融合的数据中摸索出规律,从而更精确地进行疾病的预测、预防、诊断和治疗。因此,以数据和计算方法为主的计算医学开始出现并发展。这也预示着未来医学发展范式的转向。
”人“系统涉及的数据维度尺度
早在上世纪八十年代,如何在医学领域里应用计算技术的研究就已经开始。1994年,于美国奥斯汀举行的首届计算医学、公共卫生和生物科技大会,计算医学已经开始显现成为医学重要前沿研究方向的趋势。不过,这在当时仍然是一个非常小众的研究,只有一小部分生物医学科学家在使用计算方法开展数学建模。
2012年10月,美国约翰霍普金斯大学生物医学工程教授Raimond L.Winslow在《科学转化医学》(Science Translational Medicine)上发表了一篇名为《计算医学:从模型到临床》(Computational Medicine: Translating Models to Clinical Care)的综述性文章。在文中,他指出计算医学已经从理论走向实践。Winslow也因此被公认为计算医学新领域的创始人。
近年来,随着数据的飞速积累以及大数据的处理挖掘方法不断成熟,以深度学习为代表的人工智能方法在图像识别、自然语言处理等领域取得了令人瞩目的成就。这些数据和技术领域的革新也推动了计算医学进入新的快速发展周期。

计算医学是什么?

包含哪些知识体系?

那么,什么是计算医学呢?对于这个问题,不同的专家或机构的定义在细节上略有区别。举例来说,纽约大学和约翰霍普金斯大学的解释就代表了两种不同的侧重定义。
纽约大学从计算技术和医学的关系层面,将计算医学描述为“计算医学是利用数据驱动的分析来发现复杂动态生物系统的结构、功能和进化”。约翰霍普金斯大学计算医学研究所则更强调计算技术对医学的价值:“计算医学是计算机科学和医学交界的一个跨学科领域,计算方法被开发来了解人类疾病。数学、信息学和计算模型被应用于为疾病的机制、诊断和治疗提供见解,并最终改善病人的护理”。
作为一门新兴学科,计算医学的核心是通过应用数学、计算科学来理解人类疾病的机理,为医学服务提供新洞见,提高并改善疾病诊疗水平。广义上,应用计算机和计算模型来支持医疗保健服务的医学研究的所有方面都可以被纳入到计算医学范畴。
另一个与计算医学密切相关的学科为计算生物学(Computational Biology)。根据美国国家卫生研究院的定义,计算生物学是指开发和应用数据分析及理论的方法、数学建模和计算机仿真技术,用于生物学、行为学和社会群体系统的研究的学科。
不难发现,计算医学和计算生物学有部分交叉,例如在计算基因组学领域。相对而言,计算生物学作为生物学的一个分支,归属于基础科学,主要是为医学研究提供基础支撑;计算医学则更偏向于应用科学,关注的是人体健康与疾病相关问题的研究。
计算医学的研究重点大致经历了三个阶段的演变:人体仿真与计算建模研究阶段、基因大数据驱动的计算医学应用研究阶段以及基于人工智能的计算医学与应用研究阶段。伴随现代医学向微观和宏观两方面的发展,计算医学的研究内容逐渐包含了计算基因组学、医学信息学、计算神经遗传学建模、计算神经科学、人体建模、数字人体、精准医学等领域。
中国科学院计算技术研究所高性能计算机研究中心主任谭光明阐释的计算医学内涵
作为一门较高难度的交叉学科,计算医学需要综合来自计算机科学、数学、统计学、生物化学、化学工程、生物医学工程、生物物理学、分子生物学、遗传学、生态学、解剖学等学科的知识。
计算医学研究理论基础
计算医学会涉及到使用近现代的数学工具来对生物对象进行数学建模,所以对数学的要求会比较高,尤其是动力系统和概率。而微积分和线性代数又是动力系统和概率的基础。其他必要的基础知识还包括生物学基础、医学基础、计算机基础和工程基础领域知识。
计算医学主要涉及学科及基础知识

中美领衔,剖析计算医学

研究历史及现状

白皮书在知领·全球科研项目库中进行了搜索,发现最近10年题名或关键词包含计算医学相关的项目共计3417条,并对这些项目进行了分析。
全球近十年计算医学相关领域的研究投入经费波动较大。其中,2019年全球在计算医学总研发投入经费和平均项目研发投入经费均达到了历年最高值。
全球近10年计算医学研究投入情况
在国家分布上,研发经费投入最高的前三位国家分别为美国、比利时和英国,平均项目研发经费投入最高的国家分别为比利时、斯洛伐克和澳大利亚。
各国计算医学研发投入情况
研发经费投入排名前10的项目开始时间主要集中在最近5年,重点投入在研究中心建设、基础设施投入、人才培养和个性化治疗等领域。
近十年全球计算医学领域研发投入经费前十的项目情况
为了对计算医学整体发展情况,重点研究内容及演进态势进行研究,白皮书还对1900年至今Web of Science核心合集中收录的主题为“computational medicine”的5257篇文献数据为样本进行了分析。
从文献发布时间来看,相关文献的时间跨度为1980-2021年。进入本世纪以来,全球范围内计算医学研究热度持续上涨,尤其2010年前后快速上升,呈加速趋势,计算医学研究热度持续升高。中美两国的研究趋势与全球基本保持一致。
 1990-2021年计算医学研究领域发文量时间分布比较
发文数量最高的前三个国家分为美国(2154篇)、中国(761篇)和英国(499篇)。仅从发文数量来看,中国在研究关注度上与美国相比仍有一定差距。
计算医学发文量国家分布情况
发文篇数排名前十的机构中,美国的机构占9个,主要以约翰霍普金斯大学、哈佛大学医学院、斯坦福大学等高校为主。这说明美国在计算医学领域已经形成了比较有影响力的领域研究中心。中国虽然仅有中国科学院一家机构进入前十,但排名第二且与第一名较为接近,也显示了较大的发展潜力。
计算医学发文前十机构发文数量
发文量排名前10的期刊共刊登了计算医学文献832篇(15.83%)。其中,排名第一的为《医学物理学》(Medical Physics),发文量为385篇(7.32%);IF最高的《生物信息学简报》(Briefings in Bioinformatics)发文量排名第6位。
计算医学领域发文数量前十的期刊情况
计算医学作为医学、工程与计算机的交叉学科,是多个学科专业共同的交叉研究领域。从文献学科分类统计来看,计算医学主要与放射学、核医学和医学影像、生物化学和分子生物学、数学与计算生物学、计算机科学与跨学科应用、药理学与制药、生物医学工程、生物化学研究方法学、工程、电器与电子、多学科科学、计算机科学及人工智能等学科密切相关。
对文献关键词统计结果进行分析,计算医学领域排名前十的关键词分别为:模型(model)、癌症(cancer)、表达(expression)、预测(prediction)、仿真(simulation)、识别(identification)、系统生物学(system biology)、精准医学(precision medicine)、系统(system)和算法(algorithm)。
在研究领域选择上不同国家各有侧重。中美两国的研究领域涉及面较广,各类研究关键词均有相关文献。
具体对比来看,中国的研究关键词排名前三的为药物发现(drug discovery)、精准医疗(precision medicine)、预测(prediction),美国研究关键词排名前三的则依次为精准医疗(precision medicine)、模型(model)和机器学习(machine learning)。
就研究关键词的发文数量来看,中国在计算医疗技术领域的模型构建、仿真模拟以及机器学习研究和应用领域的精准医疗、个性化医疗等五个方面的研究关注度与美国差距较大。
根据对各国近20年来研究热点变迁的分析来看,计算医学正从原有理论、模型等基础性研究向应用研究转变。
2009年以前,各国研究主题非常多样,较为集中的主题主要集中在“方法(method)”和“模型(model)”,在2002-2009年和2006-2009年分别成为日本、美国的研究热点。
2010年以后,各国的计算医学研究热点开始出现更多重叠。其中,“癌症(cancer)”在2014-2017年成为多个国家计算医学领域的研究热点;“表达(expression)”先后成为韩国、英国和中国在计算医学领域的研究重点;2018-2021年,“精准医疗(precision medicine)”成为美国计算医学领域研究热点。
通过将前述1980-2021年的5257篇相关文献进行关键词聚类,得到了10个非常清晰的计算医学聚类类别。排名前三的分别是“精准医学”“机器学习”“计算研究”领域。虚拟筛选靶点发现等药物发现相关的“计算研究”也是最新的领域方向,平均发文时间为2013年。
这些聚类结果主要又可分为三类:第一类为计算建模相关研究,从最早的放射建模相关内容到血流动力学建模、蒙特卡洛模拟、射线与疾病相关研究。其中,最突现的关键词为模型、仿真和系统。
第二类为计算组学相关研究,主要包括基因序列研究、非编码RNA和基因组学应用相关研究,并向精准医疗和药物筛选研究扩展。其关键节点包括癌症、数据库和基因表达。
第三类为基于人工智能的相关研究,包括机器学习领域和精准计算机断层扫描应用领域。
2010-2021 年计算医学领域关键词聚类图谱
机器学习子领域时间跨度从1990-2021年,是所有聚类中时间跨度最大的子领域,可以反映出机器学习技术在计算医学领域应用研究的持续性。2010年左右,计算模型成为该领域研究热点;2010-2013年计算模型与大数据高度共现,也体现出了数据驱动的计算医疗模型构建的研究热度提升;2016年以后,计算医学的机器学习领域热点集中在了精准医疗领域;最近,研究热点则主要集中在深度学习。

建模、数据、智能、精准,阐述计算医学研究内容分类

目前,计算医学相关院校对于计算医学研究内容的分类主要有以下两种:
从医学视角出发的分类方式可将计算医学划分为计算生理学、计算解剖学、计算病理学等。该种分类方法相当于做加法,即现有的医学研究门类均可开展对应的计算科学门类研究。
从基础和临床应用角度出发的分类则是将共性的基础性问题进行独立的研究,主要是技术层面的内容,包括算法研究、数学建模等;临床应用则与医学视角的方法分类相似,但精细度上稍弱于前者。
本文结合两个维度,并依据时间发展顺序,将计算医学的研究内容归纳为以下四类:
计算医学主要研究内容
以模型构建为核心的计算医学基础研究
以模型构建为核心的计算医学主要分为计算解剖学-人体数学建模和计算生理医学-系统机制模型定量分析两大类。
  • 计算解剖学-人体数学建模

精确识别健康个体和患病个体之间的解剖结构差异制约着医疗水平的发展。想要了解这两种结构的演变与差异需要将人体解剖学和计算技术以及数学理论方法相结合,计算解剖学应运而生。
计算解剖学涉及图像处理、数字集合处理、数学建模等技术,通过将人体解剖学数字化加快了解剖学的发展脚步。它将个体解剖学数据与人群解剖学数据进行形态和功能的比较分析,从解剖学的角度实现疾病的诊断、治疗评估以及预后判断,是后续诊断治疗的基础工作。
上世纪八十年代提出的“可视人计划”便是计算解剖学的典型。可视人的主要研究内容是将人体的二维横断面切片图像,经过计算机的数字化处理形成人体解剖结构的数据资料。利用三维重建技术,这些数据还可以构建出更为直观的人体结构三维立体形态。
1986年,美国国立医学图书馆(National Library of Medicine,简称NLM)开展了可视人计划(The Visible Human Project,VHP),基于MRI、CT和解剖图像创建了公开、完整、详细的人体3D解剖学图像数据。
经过多年采集,可视人男性、女性数据集分别于1994年和1995年公布。截至2019年7月,NLM面向66个国家和地区发放了大约4000个数据集的访问许可。自2019年起,VHP数据集实现完全公开,不再需要许可也可直接访问。
这些数据集主要用在人体解剖学研究的参考、测试医学成像算法的公共领域数据,以及用于构建网络可访问图像图书馆的试验台和模型等用途,被广泛应用于教育、诊断、治疗计划、虚拟现实、艺术、数学和工业领域。
首例中国可视人(Chinese Visible Human,CVH)则由第三军医大学(现陆军军医大学)历时3年完成,课题组于2002年8月完成首例男性数据集采集工作,并于同年10月完成计算机三维可视化研究工作。2003年2月,我国完成了第一例中国女性数字化可视人的数据采集和研究。
目前,在张绍祥教授带领下,陆军军医大学数字医学研究所已获取了8例完整的数字化人体全身数据集和心脏、肝脏、大脑以及膝关节等脏器的数据集,构建了男性、女性全身脏器的分割数据集和三维重建模型。这些数据集将用于基础研究和应用研究两方面。
  • 计算生理医学-系统机制模型定量分析

计算生理医学通常将人体作为一个单一的复杂系统进行多层次建模研究,使用患者数据个性化这些模型,并将其应用于改善疾病诊断和治疗。当前,计算模型通常由疾病动物实验模型中获得的数据开发,然后使用有限的人类数据集进行专门化。
基于不同的方法学,计算生理学在建模方式上存在着力学建模和机械网络模型两大研究方向。通过多层次建模方法可应用于癌症、糖尿病、心脏和脑部疾病等的诊疗和疾病预测。心血管模拟开源软件SimVascular、美国密西西比大学医学中心开发的基于Windows的综合人体生理学模型HumMod是计算生理学的典型代表。
海量基因组学数据驱动的计算基因组学研究
基因组学是一门将数据驱动作为主要研究手段的学科。处理大规模的基因组学数据天然地需要借助计算机技术。因此,机器学习方法和传统的统计学方法在基因组学中的应用一直都比较广泛。
人类基因组计划(Human Genome Project,HGP)于1990年正式启动,其宗旨在于测定组成人类染色体(指单倍体)中所包含的30亿个碱基对的核苷酸序列,从而绘制人类基因组图谱。通过全球协作,人类基因组草图在2001年发布,覆盖了大约94%的人类基因组。
然而,人和机器都无法直接读懂人类基因组这一庞大的数据。为解码人类基因组,计算基因组学应运而生。早期的计算基因组学研究重点在应用相应的数理统计算法实现对基因的注释与理解方面。此外,计算基因组学研究也从对基因的注释向表观基因组、转录组等领域发展,以便理解人体这样一个由多种细胞组成的生物体的复杂的生命活动。
基因组、表观基因组、转录组等组学测量方法的涌现带来了组学数据的激增,并进一步对组学数据处理方法提出了挑战。随着2015年的开创性研究展示了深度神经网络对DNA序列数据的适用性,利用深度神经网络处理组学数据成为趋势。
  • 基于人工智能技术的计算医疗应用研究

人工智能(Artificial Intelligent,AI)在医学领域的应用是计算医学领域近年来发展最快的一个方向。AI可广泛应用于疾病辅助诊断与诊断、提高医学图像质量、减低电离辐射、提供精准医疗建议以及减少医疗成本,显著推动了医疗模式的进步与革新。
医疗数据尤其是医学影像数据,如X射线、计算机断层成像(CT)、磁共振(MRI)、分子影像PET等产生的海量信息为依赖海量大数据的AI的发展提供有价值的科研及临床数据。
2012年以来,深度卷积神经网络技术快速兴起推动了AI突破性的进展。大致上,AI在生物医学中的应用可以分为计算机辅助诊断、患者个性化治疗和改善人类福祉三个方面。
以计算医学研究最为广泛的肿瘤学为例,人工智能技术在临床肿瘤学中可应用于癌症风险预测、筛查、诊断和治疗。算法的复杂性通常由此类数据的数量、异质性和维数决定,不同环节中主要使用的数据各有侧重。
基于AI技术的计算肿瘤学研究路径
比较经典的应用中,关于在诊断神经放射学中使用深度学习技术对脑肿瘤或继发性病变进行分割,已经发表了许多相关文献。深度学习技术在肿瘤学中另一个非常重要的应用价值点是预测毒性、治疗反应和预后,为临床医生提供有价值的决策支持系统。
  • 面向精准医疗的计算医学研究

精准医疗是以个体化医疗为核心的医学概念与模式。其关键是以患者为中心,综合运用基因组技术、生物信息技术等前沿技术手段,精确定位患者的疾病发生发展原因,并明确疾病治疗靶点,实现个性化的精确治疗。
鼻科精准手术设计是精准医疗的一个应用例子。中山大学的研究团队便利用计算机对鼻腔鼻窦精细化建模,并将其应用于精准手术设计。计算医学的建模技术以及计算流体力学技术可实现患者病灶部位的三维可视化,帮助医生充分分析患者的患病情况,模拟手术过程,推演手术预后,最终为患者筛选出最佳的手术方案。从而制定出最大限度切除病灶,同时最大程度保留患者鼻腔生理功能的手术方案。
在利用精准医疗手段治疗恶性肿瘤时,计算医学的方法也起到了至关重要的作用。将患者的基因型数据输入预测抗癌药物作用效果的计算模型中,模型可输出该患者对单种或多种药物的敏感性,从而帮助医生筛选出最适合于该肿瘤患者的治疗药物,实现肿瘤患者的精准治疗。

 计算医学学科建设如何设计?

为了应对医学范式向计算医学转变带来的挑战,更好地推动计算医学研究,世界各国的大学和科研机构纷纷成立计算医学相关的机构。比如,美国加州大学洛杉矶分校几年前把原有的生物数学系更名为计算医学系;约翰霍普金斯大学、斯坦福大学、牛津大学等高校也都开设了相关课程。在这些大学和科研机构中,计算医学或作为一个独立的院系,或作为院系下的一个部门而存在。
在我国,除了山东大学研究生专业出现计算医学专业名称外,其他大学并没有开设明确的计算医学院系或专业。计算医学研究的相关内容仍然主要划归在生物医学工程、医学信息学等专业或院系中。当然,近两年新出现的智能医学工程则是聚焦于人工智能技术为驱动的医学研究,可以算作计算医学的一个子类。
约翰霍普金斯大学是目前该领域的头部院校,其计算医学研究所隶属于生物医学工程系,主要目标是开发人类疾病相关的定量计算模型,并让这些模型能够个体化应用,以改进疾病的诊断和治疗。
计算医学研究所制定了一套体系性的计算医学本科的授课课程。主要涉及大量计算机,应用数学,以及工程等专业内容。整个课程设计是顺应了计算医学“医、工、信”交叉的特色,在培养过程中突出强调打牢学生的数学、信息学和工程学基础。
值得一提的是,约翰霍普金斯计算医学只是其生物医学工程系中的一个研究方向,主要集中于研究各个医学领域下的模型的构建。而机器学习与云计算、基因组学、医学图像信息处理等相关内容则在生物医学工程系的其他研究方向中涉及。
约翰霍普金斯计算医学研究所主要研究方向
约翰霍普金斯其他生物医学工程院系相关研究方向
作为约翰霍普金斯生物医学工程教授,Raimond L. Winslow也是公认的计算医学新领域创始人。该领域使用分子生物学、生理学和疾病解剖学的创新计算模型来理解、诊断,治疗疾病并改善病人护理。他对从定量模型的角度理解心脏病的兴趣导致了计算医学作为一门学科的发展。
在研究方向上,他开发了基于实验的计算模型,并将其应用于深入了解心律失常的分子基础。其研究团队的众多成就之一是率先使用弥散张量磁共振成像(DTMRI)重建心室的几何结构和纤维结构。目前,DTMRI已成为以高空间分辨率测量心脏纤维结构的标准方法。
尽管各个学校将建立的院系或开设的专业冠以“计算医学”之名,但其研究的内容和侧重点各不相同。综合来看,目前各高校计算医学的学科建设主要涵盖了三个方向:
第一,基于生物学背景知识开发计算工具,揭示疾病的分子机制,辅助疾病的诊断、治疗以及新药的开发。第二,在医疗相关数据快速积累的情况下,利用机器学习的方法加速疾病的诊断和治疗。第三,对人体或者生物系统进行数学建模。

  让个性化医疗照进现实,

计算医学发展展望 

计算医学的发展有望实现关于健康和疾病的量化理解,带来医学发展范式的变革,但与主流学术领域相比,它仍处于边缘的位置。现有的模型对现实情况的模拟仍然是不充分的,找到能够定义虚拟世界与经验世界之间联系的工具,尤其是计算机仿真模型的有效性仍然比较困难。
基因组学、医学成像、诊断技术和转化医学方面的不断发展,人工智能的深度融合,以及共性服务、共性平台、公共设施的不断完善将为我们开发癌症、遗传疾病和传染性疾病的诊断工具和新疗法提供可能性。计算医学作为关键的融合手段,将构建人体“数字孪生”,实现精准健康维护,让个性化医疗照进现实。
扫码下载《计算医学:数智时代的医学发展新范式》
白皮书版权属于浙江数字医疗卫生技术研究院,并受法律保护。转载、摘编或利用其它使用本白皮书文字或观点内容,请注明“来源:浙江数字医疗卫生技术研究院”,若违反上述声明者,将被追究其相关法律责任。


*封面图片来源:123rf

动脉网所报道的企业,请点击文末左下方“阅读原文”填写表单,我们的工作人员将尽快为您服务。

左右滑动查看更多

声明:动脉网所刊载内容之知识产权为动脉网及相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。
动脉网,未来医疗服务平台
(0)

相关推荐