以医学影像大数据为例探讨影像信息学及其应用
导读:讨论影像大数据与医学影像信息学的相关性,总结影像大数据在临床中的应用。用“大数据图像信息学”和“大数据放射信息学”关键词对2012年至2017年间正式发表的科研论文进行检索,对检索结果抽样分类并分别探讨了其临床应用。医学影像信息学在影像大数据的背景下,已在诊断和治疗、教育和科研、成本控制和效率提升及辐射剂量监测等方面开展应用。影像大数据是医学影像信息学的重要组成部分,大数据应用前景生机蓬勃,但离大规模临床推广还有一定距离。
大数据,指无法在一定时间范围内用传统软件进行获取、存储、管理及分析的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据的特点是指数据的体量大,数据的种类多,数据更新速度快及大数据发展趋势的不确定性。
近年来,公共医疗成为大数据快速发展的行业,针对海量的诊断报告、病理数据、药物清单和治疗方案,借助大数据平台可以建立基于病例特征的疾病数据库,医生可以根据患者信息制定有效的治疗方案。
方法
通过谷歌引擎搜索正式发表的中英文科研论文,由于这是一门新兴学科,所以将查询时间设置为2012年至2017年,查询关键字为“大数据图像信息学”和“大数据放射信息学”及各自对应的英文。鉴于目前通用的科研论文均采用.pdf格式,所以对查询类型用“filetype:pdf”子句进行限定。最后对查询结果进行抽样分类,并对各分类主题进行探讨。
结果
检索结果主要由两大类构成,第一类从广义上讨论与大数据相关的基本概念及其在医学影像信息学中所发挥的作用。第二类则使用大数据和医学影像信息学技术解决医疗实践中的具体问题。
由于综述研究的广泛性和复杂性,本文并不对具体文献作全面的分析和总结。将重点关注大数据的基本概念及其在影像信息学中的应用。讨论的应用范畴主要涵盖诊断和治疗、教育和科研,成本控制和效率提升及辐射剂量监测几方面。
影像大数据 影像大数据是由DR、CT、MR等医学影像设备所产生并存储于PACS系统内的大规模、高增速、多结构、高价值和真实准确的影像数据集合。胎心监测、免疫分析、DNA筛查数据均可用于影像大数据应用方案。
虽然医学影像数据相当丰富,但用常规方法从中提取的有用信息却相对较少。放射图像不但数据量庞大,而且针对性极强,常用于解决具体的临床问题。例如,X光片主要用于检查肺部及支气管炎症,这就容易导致放射数据的观测力贫瘠现象,而临床记录则包含了所有与患者诊断、治疗过程相关的信息,因此更富有观测力。
影像信息学 影像信息学的主要目标是将传统意义下的成像、后处理、PACS等内容有机结合,提供更有针对性、信息含量更丰富且更准确的图像解译,获得更有价值的图像信息,以便完成人类能力难以胜任的工作。
数据挖掘是将属性相似的某类对象聚类,从聚类数据中提取有用信息并将其转化为可理解对象的过程,如今该过程可用人工智能、机器学习和深度学习等方法实现。由于这些方法能处理的数据量更多,过程更加稳定,结果也更加有效,可弥补因持续工作而造成的关键性结果缺失或疲劳性降速。
影像大数据的具体应用
诊断和治疗流程的合理化 计算机辅助诊断(Computer Aided Diagnosis,CAD)和临床决策系统(Clinical Decision Support,CDS)是影像大数据应用的重要组成部分。
CAD提供了各型数据融合的接口,既包括影像资料,也可以是病理报告,还可以是电子病历(Electronic Medical Records,EMR)。文献将影像数据和组织切片数据相结合,通过CAD系统建立了疾病诊断模型、选择最优药物剂量和放射疗法并制定了最佳器官移植时间。规划制定是CDS大数据应用的一个重要用途,在制定成像检查规划前,可以通过EMR全面收集关于患者的各类信息,如年龄、症状、病史、遗传史、耐药性、身体状况及历史健康等数据[7]。该过程可解读为对某项检查进行的驱动力分析,并据之选择最适宜的成像手段。
教育和科研水平的改善 用大数据相关性分析代替传统的假说驱动研究有比较优势。病例选择、离群效应分隔标准及变量说明等过程常常是既耗时又缺乏统计意义。使用实际数据意味着研究人员可以方便地辨识相关人群,并确定哪些患者可能会对特定治疗方案产生反应。运用大数据分析则能够以较为自然的方式展示医疗条件的变化过程,以便跟踪总体发展趋势。
使用数据挖掘技术可对放射技师或医生做教育评分。例如,使用评级系统对历史影像解读意见进行调阅并评分,分析各评定误差的临床学意义,而这种自我评价或同行评价的方式不但可以作为操作技能的质控标准,还可成为提升医疗服务质量的教学工具。
成本控制和效率提升 合理利用大数据可有效降低医疗成本,病人医疗成本主要是由检查费用、药品耗材及护理费用构成,通过大数据对不同病种的预期成本和预期收益进行预测和控制,不但可以减少不必要的检查项目,还可以合理调配医疗资源。
提取病人EMR大数据可以建立某些疾病的早期预测模型,能够有效降低死亡率。一项最新的机器学习研究项目表明,提取确诊病例和健康病例的特征,通过分类决策模型进行深度学习,能够大幅提高充血性心力衰竭的确诊能力。
辐射剂量监测 影像大数据应用方案的另一个领域是辐射安全控制,具体地讲即是如何减少患者的辐射剂量。目前,与CT辐射剂量相关的主要参数主要有CT剂量指数和剂量长度积,采用传统指数估计患者剂量既不全面也不准确。
现在,已经可以通过大数据方式来减少患者遭受的检查辐射,华盛顿大学采用了剂量跟踪技术从多个CT成像设备中获取扫描数据,建立了受检者体径与CT剂量间的相关模型,不仅可以精准定位病灶,而且有助于验证其成像效果并控制放射剂量。
发展方向 大数据及其在放射学中的应用研究是一门新兴课题,在一些领域取得了初步成果,整体研究并不成熟。利用PACS或转化医学整合生化、病理、分子和影像数据建立综合数据中心,通过标记物的鉴别准确定位病灶的医疗模式是影像大数据的发展方向。随着病例样本的积累,算法的不断发展,将在更为广阔的范围内涌现出越来越多的医学影像大数据解决方案,影像信息学也必将迎来更深层次的机遇和挑战。
影像信息学是医学影像学近年来的发展新方向,已在影像大数据临床应用中展现出强劲动力。在大数据浪潮的推动下,影像信息学必将为临床实践提供更为准确的决策动力,医疗资源配置更加合理,医疗服务水平进一步提高。
文章来源:《中国数字医学》杂志2018年第12期,作者及单位:赖思渝 杨汉丰 杜勇,川北医学院影像学院 川北医学院附属医院放射科。