人工智能在卒中方面的应用
背景
脑卒中的诊断及治疗高度依赖于来源于影像学研究方面的信息。CT (non - contrast computed tomography, CT)和MRI(magnetic resonance imaging, MRI)均可用于区分缺血性卒中和出血性卒中,不过仅基于临床特征这二者很难区分。CT低密度扫描和MRI的DWI高强度扫描可以识别不可逆的损伤组织,但在急性情况下MRI的敏感性更高。血管造影和灌注成像序列可以识别大血管闭塞,并可以选择给予患者进行血管内治疗。FLAIR-DWI不匹配提供了未知起病时间患者的信息(包括觉醒型卒中)。目前的方法旨在了解成功的再灌注或持续的大血管闭塞的短期后果。关于卒中成像的一个重要警告是,必须迅速完成,因为更及时的治疗会给患者带来更好的预后。卒中影像分诊途径中的大多数步骤都需要放射科和神经科医生的协助,而这一步通常是时间紧迫的。而且这些步骤所需的专门知识可能并非在所有地点或时间都可用。因此人们开始感兴趣如何在卒中成像评估中应用自动化方法。
人工智能(AI)是一个宽泛的术语,它反映了使用计算机通过精确定位来执行人类可能感到困难的任务。例如,人类虽然觉得高级计算很困难,但计算器技术并不被认为是人工智能,因为我们理解并知道如何将其分解为离散的步骤。然而,人脸识别是人类擅长的一项任务,但识别人脸的算法通常被视为人工智能,因为我们无法准确地表达这是如何完成的。机器学习(ML)是人工智能的一个子集,算法无需显式编程就可以从数据本身学习。ML方法反映了广泛的统计技术,从线性回归到更复杂的方法,如支持向量机和决策树。ML方法可以进一步分为监督学习和非监督学习,两者的不同之处在于前者需要获得黄金标准标签,而后者试图从数据本身寻找隐含的答案。虽然机器学习方法近年来变得越来越流行,但在过去的十年里,一种基于类似于人类神经网络架构的特定监督机器学习方法的出现,导致了性能的巨大飞跃,这种方法被称为深度学习(DL),因为它有多个内层,可以被认为是一种革命性的技术。与以往需要人类识别图像特征的方法相比,在已知输出数据集上训练的深度神经网络可以学习到组织数据的最佳特征。在这篇综述中,我们将讨论用于脑卒中成像的ML方法,重点是DL的应用。
关键词:人工智能 深度学习 出血 缺血 机器学习
一、从线性阈值到深度学习
早期的图像分析方法依赖于将固定的阈值应用于定量图来预测感兴趣的信息,如随访时的梗死组织数量或出血性转化的位置。虽然实施简单,但应用阈值可能会由于患者队列、扫描异质性以及后处理差异而失败。更重要的是,就组织结果而言,潜在的假设通常在生理学上过于简单。这取决于许多因素,可能反映在其他成像序列或模式上。由于这种复杂性,为最好地代表整体治疗潜力和指导管理,需要灵活地结合不同种类的影像学和临床特征。
基于图像的算法性能的差异是由于图像特征的选择和如何结合它们的空间关系信息的方法。最近,其他的ML方法已经被提出,它们超越了回归的限制,是将它们组合起来,这种技术称为线性或逻辑回归。预测一个连续的变量,如梗死面积,可使用线性回归。如果目的是将患者分为二进制结果,如良好的临床结局(即改良Rankin量表评分≤2分),则可以采用逻辑回归。DL方法的真正变革之处在于,它们不需要先验假设什么图像特征是重要的,相反,网络学会了隐性地识别它们。使用DL,特征被自动识别并编码到隐藏层的网络中,从而大大减少了实现时间。关于DL方法的一个重要一点是,它们在访问大量数据时不断改进,而传统的ML方法尽管访问相同的数据,但往往趋于稳定在较低的性能水平上。ML方法的具体选择仍然是一门艺术,而不是一门科学,虽然通常的DL可以很好地处理大量数据,而经典的ML方法对于较小的数据集有优势。认识到DL仍处于早期阶段是很重要的,而且它的性能并不总是超过涉及手工选择特性的经典方法。
二、AI提高图像质量和速度
脑卒中成像对病人分诊至关重要,但人们担心脑扫描有关的时间延误。因此,有人反对使用先进的成像技术,如CT灌注成像或MRI,它们比非对比CT和CT血管造影术需要更长的获取和处理时间。大多数MRI卒中方案需要不到10分钟的扫描时间,不过MRI确实比CT需要更详细的筛查和病人转移时间。因此考虑到DWI的高组织对比度及其对组织极有可能不可逆损伤的特异性,减少MRI扫描时间仍然是非常重要而且是可取的。
人工智能启发的方法可以提高医学图像的质量,能更快或更小剂量获取图像。特别是基于深度卷积神经网络(CNNs)的重构算法非常适合这一任务。一个与急性卒中成像相关的例子是使用CNN去噪的能力,使用动脉自旋标记MR脑灌注图像,用更短的扫描创建诊断图像。这种方法也被应用于其他的MR序列,包括定量易感图谱,可以检测脑出血和钙化。考虑到MR造影剂给药后钆沉积的问题,一种能够显著减少诊断成像所需钆量的人工智能方法可以应用于大剂量灌注加权成像。鉴于现代多探测器CT扫描仪的速度,很难显著缩短采集时间,CNN减少辐射剂量就可能有助于减轻与CT灌注成像相关的辐射问题,这是一个相对高剂量的程序。
人们还可以绕过传统的标准生物标志物的计算,例如从源CT或MR灌注图像计算脑血流和容积。这是一个容易出错的过程,有许多步骤,包括识别动脉输入函数和噪声敏感的计算步骤,其中示踪动力学标记提取基于动态组织增强和动脉供应。其生成的灌注图用于预测梗塞(核心)和高危组织。然而,有了人工智能,这种预测也可以直接从灌注源图像本身进行。在一项对44例患者的研究中,CNN比包括脑血流量、血容量和T max在内的灌注标志物的线性组合表现更好。
三、预测当前信息
(一)、发病时间
DWI和FLAIR病变之间的不匹配被认为是判断卒中是否超过3到4小时的放射学指标。如果病变在DWI上可见而FLAIR上不可见,则认为卒中发生的时间较近。在实践中,在视觉上检测DWI-FLAIR的不匹配是具有挑战性的。首先,使用一种基于神经网络的自动编码器技术来识别MR源灌注图像的特征。在第二步中,使用不同的监督学习算法(支持向量机和逐步回归)将这些特征与DWI和FLAIR图像相结合。在105例中风患者中,报告了一个高达0.68的曲线下面积(AUC)来将患者分为症状出现前/后4.5小时。另一组使用类似的方法,包括多模态MRI对患者进行6小时前/ 6小时后的分类,使用逻辑回归显示出相同的效果。
(二)、自动化方面得分
阿尔伯塔卒中项目早期CT评分是一种总分10分的大脑中动脉卒中分级,用于对患者进行治疗和纳入临床试验。一个名为aspects的软件包已被证明不逊于人类专家,其非劣效要求设置为10%。一项患者(具有已存在病理包括脑白质病变、梗死和非典型实质缺陷)随访研究中,自动化方法与人工评估(0.77–0.80)相比表现出较低的性能,准确性为0.67。
(三)、识别LVOs
利用手工制作的特征,一些使用自动管道的研究已经成功地从CTA图像中识别前循环的LVOs;例如,有患者显示出95%的敏感性和79%的特异性。据CNN报道这可能是用于检测颅内大血管闭塞。结果表明,在650人的研究中,敏感性为82%,特异性为94%。在实践中,这已被证明可以为高级医生提供早期警报,有助于其确定任务的优先级。
(四)、短期组织细分:核心/危险组织的识别
关于急性缺血性病变的自动识别和病变演变已经有大量的工作报道。在急性卒中研究中,两种值得确认的重要组织类型是不可逆损伤组织(核心病变)和缺血半暗带(危险组织)。由于这些病变有一个生理上的而不是成像的定义,所以建立一个参考来训练和验证自动化方法是具有挑战性的。
人工识别CT灌注下的核心病变难度较大,MR手工勾画核心及高危组织可作为AI算法的目标。训练这种网络的一种方法是在时间接近的情况下获得成对的CT和MRI。这是2018年缺血性卒中病变分割(ISLES)挑战的任务,其中表现最好的算法使用了3D神经网络架构,获得0.56的Dice分。训练(63例)和验证(40例)的数据来自症状发作后8小时内就诊且在CT灌注后3小时内获得MR DWI的患者。
四、预测短期成像生物标志物
灌注-扩散失配可以被认为是一个非常简单的二分式预测模型。该模型假设,如果再通,预期结果与急性核心病变一致。若不能再通,预期的梗死也将包括以前的危险组织。从生理和ML的角度来看,基于急性成像直接预测短期组织结果可能是更好的方法。短期成像结果通常由亚急性DWI或T2-FLAIR所识别的病变来确定。
MR和CT均已被报道使用逻辑回归简单组合急性成像方法。一项对14名患者在发病12小时内进行扫描的MR研究中,显示发病后至少5天观察到的最终梗死灶可预测为84%的特异性和66%的敏感性。CT显示在一项基于发病后<7小时CT灌注和CT血管造影成像来预测2 - 7天后组织结局的研究中,161例患者中整体AUC证实为0.85±0.07。然而组织梗死可能依赖于成像标记物之间的相互作用;血容量变化的影响可能会被同时发生的血流变化所调节。在逻辑回归中,必须在分析之前明确地说明相互作用。然而随着相互作用的复杂性和预测量的增加,这种方法变得效率低下。
出血性转化是缺血性卒中最令人担忧的并发症之一。尽管将诸如大DWI病变之类的代用标记物用于风险分层,但预测这种并发症或确定其发生的位置仍不是最佳选择。对于MR,已经使用灌注加权成像和DWI比较了一系列ML技术,以预测出血性转化的发生和位置。一项研究将具有单个隐藏层的神经网络的性能与许多经典的ML技术进行了比较,包括线性回归、分类、回归树,具有径向基函数核的支持向量机以及线性判别分析。在155例患者中,通过核能谱回归可以看到最佳性能,AUC为0.84,Dice评分为0.71。最近,据CNN报道,来自2个卒中中心的77例患者经历了出血性转化的表现。在前循环中预测出血转化位置的敏感性和特异性分别为89%和60%,AUC为0.88。对于CT,大多数研究使用经典的ML方法,例如支持向量机。在一项针对116名rtPA患者的研究中,AUC为0.62。这种表现可与放射诊断评分(AUC 0.63)相提并论,但低于HAT评分(AUC 0.72)。有趣的是,随着急性国立卫生研究院临床特征的增加,ML表现显着提高(AUC 0.74)。
五、预测长期结果
虽然病变的识别和短期影像学进展已获得极大的关注,但长期的功能结局无疑是最重要的。随机森林已被用来预测功能独立性,定义为90天改良Rankin Scale得分≤2,并且良好再灌注,定义为改良的TICI≥2b.40。在MR CLEAN登记处的1383例患者中,作者表现出预测再灌注的不良表现(AUC,0.53-0.57)。但是,仅使用基线变量可以很好地预测功能独立性(AUC,0.77–0.79),而当包括治疗变量时,可以很好地预测其功能独立性(0.88–0.91)。尽管随机森林的性能最佳,但其他机器学习技术(如逻辑回归)实际上具有相同的性能。使用经过计算优化的XGBoost版本的随机森林方法在预测90天临床效果方面也表现出了良好的性能。在512位接受CT,CTA和CT灌注成像的患者中,预测90天改良的Rankin Scale评分≤2的AUC为0.75。24小时加入NIHSS可将性能提高到0.89的AUC。
在204例患者中,训练了一组神经网络以预测24小时NIHSS≥4分改善,并在90天内对Rankin量表评分进行了修改,评分为0至1。对CNN进行了非对比CT数据训练, 在演示中,使用包括血压和NIHSS在内的临床数据对具有2个隐藏层的全连接前馈神经网络进行了训练。结合起来,他们提供了71%(用于改善NIHSS)和74%(用于良好的临床结果)的准确性。作为比较,3个临床预后评分(HIAT,THRIVE和SPAN-100)达到了65%(改善了NIHSS)和68%(良好的临床结果)的最高准确度,强调ML方法可以胜过现有的结果预测工具 。
结论
在缺血性卒中的急性和亚急性期,人工智能(AI)具有许多临床上有价值的可能性。大多数研究使用回顾性数据,样本量通常在20到几百之间。显然需要在成功的概念验证报告的基础上进行更大的评估,尤其是前瞻性的评估。尽管还有很多工作要做,但是这里介绍的一些方法已经获得了监管部门的许可,并且可以通过商业途径获得。尽管目前大多数注意力都集中在提高预测准确性上,但是赋予AI解决方案以能够解释其预测的能力可能会促进更好的临床适用性和接受度。利用AI来识别新的疾病机制以及影像学和临床结果之间的未实现联系(可预测短期和长期结果)将使AI加快患者管理并提高安全性。它也可以作为假设产生的手段,为真正的深度学习和急性缺血性卒中的理解铺平道路。
评述:
目前,医生通过临床特征判断卒中的性质非常困难,因此,对他们影像学检查非常依赖。影像学资料可以帮助区分缺血性还是出血性卒中、判断病变范围、血管阻塞、发病时间判断、预后推测等。对卒中患者而言,时间因素与患者的预后密切相关,及时的准确的诊断和处理非常关键。但是,目前临床上,这项工作要在有经验的放射科医生和神经科医生密切协作的前提下才能完成,这一条件不是对所有地点和时间都能满足的。于是,大家将目光转向了人工智能AI。
简单说来,人工智能是指利用计算机技术,模拟人类的认知过程,帮助人们完成一些令他们感到困难或难以精确描述的任务。我们希望通过人工智能自动分析影像学资料,准确的对卒中进行诊断,病情变化追踪和预后判断(包括短期和远期)。机器学习(ML)是人工智能的亚分支,最近十年在卒中领域取得了极大的进展和突破,将深度学习(DL)也引入其中。这篇综述探讨了AI应用于卒中影像学研究的现状。
首先,AI实现了从线性阈值到深度学习的跨越;其次,AI提高了影像质量和完成速度;第三,AI预测当前重要信息;第四,AI快速判断短期治疗效果(如再通与否);第五,AI可以预测远期功能恢复状况。
在临床上对急性和亚急性缺血性卒中的患者AI可以做更多的工作。目前AI中深度学习的主要短板是缺乏大量的影像学数据库进行学习。以往的研究大多基于较小样本的回顾性研究上,我们急切需要大样本的前瞻性研究报告。我们的工作重点是提高AI的准确性,这样可以不断提高临床的接受程度,从而提供患者的安全性。我们还可以通过AI加深对缺血性卒中的理解。 编译:辛平平
述评:谭弘
点击小程序码