人工智能用于自动化脑室结构分割和容积计算:一项评估小儿脑积水的临床工具

研究背景

一百多年前,Walter Dandy在有关气脑造影的开创性论文中报道了第一种可视化脑室的技术。从那时起,在CT或MRI扫描仪上对脑室进行成像已成为治疗脑积水和其他脑脊液异常患者的常规检查方法。脑脊液分流是最常用的神经外科干预治疗策略。脑室大小和形状的改变可以帮助阐明患者的临床状况,从而指导手术策略。然而,放射科医生和神经外科医生通常仅通过读片来评估脑室大小。随着时间的推移,脑室大小的评估也会因扫描厚度,头部角度和不同扫描之间的序列类型的差异而变得复杂,这常常限制了直接比较。此外,线性估计(例如额枕角比率(FOR))也可用于评估脑室大小,但不能完全评估脑室容积的变化。脑室体积计算又取决于脑室的结构分割,这在手动执行时既费时又费力。然而,持续而准确地追踪脑室容积将显着改善并规范脑积水患者的终生临床管理。

目前存在有限的可用于脑室结构分割的自动化工具,但这些工具主要是不太适合临床使用的研究软件,需要进行体积更大的3D T1加权扫描,并需要更长的采集时间,耗时的图像处理程序和手动质量控制。此外,大多数扫描是为健康的成年大脑量身定制的,并且在患儿大脑或畸形大脑中不具有高保真度,例如来自潜在的肿瘤。评估小儿脑室结构的自动化方法也仅限于小型人群。

为了满足临床上对评估脑室容积的有效,可靠和定量方法的需求,本论文开发了一种基于深度学习的临床工具,可以长期评估脑积水患儿的脑室容积。

研究方法

研究设计和研究队列

在各机构的机构审查委员会批准后,斯坦福大学Lucile Packard儿童医院与四家儿科医院之间就这项多中心研究达成了数据使用协议。对2002年至2018年获得的MRI数据进行回顾性分析,以鉴定年龄≤22岁的后颅窝脑肿瘤并经影像学确诊的存在脑室扩大的患者(图1)。在没有症状或脑室增大的情况下,脑积水可能难以诊断。因此,出于本研究的目的,本研究仅纳入急性阻塞性脑积水的患者。具体而言,本研究选择患有后颅窝肿瘤的患者,因为它们代表了队列更均一的病因,需要进行干预。主要的脑积水队列包括200例导致阻塞性脑积水的后颅窝肿瘤患者(Lucile Packard儿童医院,n = 50;西雅图儿童医院,n = 75;病童医院,n = 60;代顿儿童医院,n = 15)。所有患者在接受肿瘤治疗之前均存在脑积水临床症状(头痛,恶心或呕吐)。本研究纳入了接受紧急脑室外引流的患者,但排除了在第一个可用MRI序列之前进行永久性分流,第三次脑室造口术或肿瘤切除术的患者。从本研究单位的MRI阴性的神经学正常儿童数据库中,按年龄进行随机分层抽样,从199名对照患者中选择200项扫描数据。所有患者均进行了T2加权扫描。在所有对照和部分脑积水患者中,获得了3D T1加权变坏的梯度采集(SPGR),磁化准备的快速采集梯度回波(MPRAGE)或3D体积(BRAVO)T1加权图像。由经认证的神经放射科医生(K.W.Y .已有11年以上的工作经验)进行了图像质量控制。

将研究队列(400次T2加权扫描)分为训练集(n = 266;137个对照和129个脑积水)和验证(n = 67;34个对照和33个脑积水)以进行模型开发和优化,并保留一组测试组(n = 67;29个对照组,38个脑积水)用于模型性能的最终评估。为了进一步评估模型在临床上的通用性,本研究对来自第五家机构(犹他州初级儿童医院,n = 9)的脑积水患者的T2加权扫描进行了前瞻性测试。来自该独立机构的扫描未用于模型开发,因此可以作为原始数据以外的临床使用情况下模型性能的测试。

Ground Truth Labels

由神经外科住院医师(J.L.Q.)和医学生(L.H.K.)对所有轴向切片进行脑室结构的手动分割。结构分割由认证的小儿神经放射科医生(K.W.Y.)进行审查。脑室分割始于第一个轴向切片,该切片包含可见的侧脑室,一直延伸到Magendie和Luschka的孔下方。分割侧脑室,第三脑室和第四脑室,包括脉络丛。对于脑积水队列,将未被后颅窝肿瘤遮盖的可见脑室系统(包括第四脑室)分割。使用ITK-SNAP软件进行了手动分割。Ground Truth Labels指为这个测试收集适当的目标(可证明的)数据的过程。

深度学习模型架构和训练

本研究采用了2D U-net,16先进的卷积神经网络(CNN)架构,以使用T2加权扫描作为输入来自动分割脑室。深度学习模型由编码器-解码器结构组成:编码器将体积映射到抽象的低分辨率编码,而解码器将此编码扩展回全分辨率分割图像,该图像指定切片中每个像素为脑室的概率是否有脑室。编码器权重是根据ImageNet数据集上预先训练的视觉几何组(VGG-11)架构改编而成的,该联盟由120万以上的2D图像组成。对模型进行了训练,以最大程度地减少分割输出的Dice损失。

研究结果

研究队列的一般特征

对照队列(199名患者,200次扫描)的年龄范围为0至19岁(中位数为8岁),男性为48.7%(n = 97)。本研究可视化了各个年龄段的脑室容积,以近似正常人口曲线。在本研究的队列中,在出生后50个月中,体积急剧增加,在4至8岁之间达到平稳,此后直到14岁为止,体积一直增加。

阻塞性脑积水队列(n = 200)的年龄范围为0至22岁(中位数5岁),其中56%(n = 112)男性。由于临床症状不稳定,27例脑积水患者在MRI之前曾紧急进行了脑室外引流,但仍存在脑积水的影像学表现。

3D T1加权扫描的脑室体积的计算与T2加权扫描的脑室体积的计算具有可比性

通常选择具有更薄切片和更大解剖学细节的三维T1加权扫描进行体积分析。鉴于T2加权扫描在临床上有更广泛的应用,我们证明了使用T2加权扫描手动确定的脑室容积与基于3D T1加权扫描的手动计算相当(补充图3)。尽管与3D T1加权扫描(1 mm)相比,T2加权扫描(2-6 mm)的切片厚度更大且变化更大,但是从两个序列得出的体积计算紧密相关(r2 = 0.76)。

深度学习模型性能

在T2加权扫描的保留测试集上,模型细分非常准确,Dice总体得分为0.901。脑积水患者(Dice系数0.946)的分割和体积计算比对照组患者(Dice系数0.856)更准确(F = 375.4,p <2.2×10-16)(图2和3,) 。

在每组中,具有较高脑室容积的患者模型表现更好(对照组:r = 0.39,p = 7.3×10-9;脑积水:r = 0.59,p <2.2×10-16)。细分的准确性不会随年龄而变化(F = 1.39,p = 0.24)。模型的容积计算与FOR和Evans的比率(分别为r2 = 0.92和0.79)密切相关。

为了进一步测试模型的通用性,本研究评估了第五家机构的9例脑积水患者的结构分割准确性,该机构未用于初始模型开发。即使在这个完全外部的测试装置上也保持了准确性(Dice0.926;图3)。在图形处理单元级别,每次扫描进行模型评估需要1.48秒(在中央处理单元级别,预计需要25分钟)。

与FreeSurfer软件比较

在可用的3D T1加权扫描中,FS被用于一部分保留测试集的脑室分割和容积计算。鉴于只有12名来自保留测试集的脑积水患者进行了3D T1加权扫描,本研究选择了11个年龄相匹配的对照可用于FS评估。两组的年龄从几个月到13岁不等(对照组中位数为7岁,脑积水患者为6.5岁)。FS仅能分割11个对照组的8个和12个脑积水组的3D T1加权扫描中的9个,而其余扫描会产生处理错误。在FS成功处理的扫描中,对照的Dice系数为0.55,脑积水3D T1加权扫描的Dice系数为0.86(图4和5)。对于完全相同的患者,DL模型更为准确(对照组的骰子系数为0.83 [p = 6.4×10-5],脑积水的Dice系数为0.94 [p = 8.5×10-5])。每次患者扫描,FS耗时8.2至207.3小时(中位数20.3小时)进行脑室分割和容积输出,而深度学习模型的每次患者扫描则花费1.48秒。

图1 本研究队列的入选示意图

图2 T2成像中深度学习(蓝色)与groud truth(绿色)对脑室结构分割和脑积水容积计算模拟图

图3 深度学习与groud truth对脑室结构分割和脑积水容积模拟结果的相关性分析

图4 3D-T1成像中FS软件(紫色)与groud truth(绿色)对脑室结构分割和脑积水容积计算模拟图

图5 FS软件与groud truth对脑室结构分割和脑积水容积模拟结果的相关性分析

研究结论

本研究队列包括来自美国4家儿科医院的200名梗阻性脑积水患儿以及199名对照儿童。手动脑室分割和体积计算值用作“ground truth”数据。以T2加权MR图像为数据输入神经网络结构自动描绘了脑室并输出了体积测量值。在保留的测试集上,使用Dice相似系数(0到1)评估分段准确性,并使用线性回归评估体积计算。在第五家医院的外部MRI数据集上评估了模型的通用性。将深度学习模型的性能与FreeSurfer研究细分软件进行了比较。

本文提出了一种用于自动脑室结构分割和体积计算的深度学习模型,该模型比当前可用的方法更准确,更快速。该模型具有近乎即时的体积输出和跨机构扫描仪类型的可靠性能,可适用于脑积水的实时临床评估并改善临床医生的工作流程。

讨论与阅读体会

JNS杂志2020年12月1日在线发表了一项人工智能用于计算脑积水患儿中脑室容积的临床研究。本研究提出了一种深度学习的人工智能模型,通过使用T2加权MR图像来计算有无梗阻性脑积水的患儿的脑室容积。本研究在来自四家不同医院的400多次扫描中训练和测试了最新的深度学习体系结构,这是迄今为止同类研究中规模最大的一次。本研究前瞻性地将模型应用到了对模型开发没有贡献的第五家机构。因此,该深度学习模型可以跨不同磁共振机器可靠地实现计算目标,而不会降低其性能。

小儿脑积水的患病率约为10,000例活产婴儿中的6例,并且在接受分流术的第一年内,有一半的患者接受分流器插入术时会出现分流器的失灵。因此,接受分流器治疗的脑积水的儿童要接受大量的影像学检查,以便进行常规监测和临床评估,但这些影像学检查结果并不总是直接可比的,具体取决于扫描厚度,头部角度或旋转以及每次扫描的序列类型。对于脑脊液分流患者,毫无疑问,一种客观、一致、定量的方法可用来衡量脑室容积随时间的变化或稳定性,从而有益于脑室监测。然而,手动脑室结构分割复杂,当前的自动方法耗时且需要大量人工质量控制,还依赖于体积3D T1加权扫描,需要花费更多时间来获取,并且通常难以应用于临床实际使用。

本研究模型需要最少的预处理,并且在训练完成后需要最少的人工质控。尽管年龄相关的白质T2信号发生了变化,但本模型的准确性并未随年龄变化,这表明深度学习模型与髓鞘形成状态无关。重要的是,头部倾斜和旋转(这通常是扫描仪中的新生儿和较小的孩子所遇到的问题)不会降低测量脑室容积的能力。尽管有27例患者存在脑室分流管,但深度模型仍然可以可靠地计算出脑室容积,这表明本研究的深度学习模型即使永久性地放置脑室分流器也可以做到精准计算。

译者简介

钟俊杰,医学博士,神经外科专业,毕业复旦大学附属华山医院。博士期间师从朱剑虹教授,从事认知障碍与神经再生,及干细胞研究。

(0)

相关推荐