【文献快递】对通过凸面优化伽玛刀放射外科实时逆向计划的临床评估:在前庭神经鞘瘤患者系列中的前瞻性比较试验
《Acta Neurochirurgica (Wien)》杂志2021年1月5日在线发表法国 Aix-Marseille Université, Hôpital de la Timone的Jean Régis , Hussein Hamdi, Anderson Loundou等撰写的《对通过凸面优化伽玛刀放射外科实时逆向计划的临床评估:在前庭神经鞘瘤患者系列中的前瞻性比较试验。Clinical evaluation of a real-time inverse planning for Gamma Knife radiosurgery by convex optimization: a prospective comparative trial in a series of vestibular schwannoma patients 》doi: 10.1007/s00701-020-04695-x.)。
背景
伽玛刀放射外科(GKRS)逆向剂量计划目前还远远不能有效地与经验丰富的专家成熟的剂量计划的质量竞争。提出了一种基于“高效凸面优化算法(efficient convex optimization algorithms)”的逆向计划(IP)方法,实时提供高质量的剂量计划。
材料和方法
招募86例接受GKRS治疗的前庭神经鞘瘤(VS)患者。第一作者有27年的经验,已经制定并交付了超过15,000个剂量计划,他所制定的治疗计划可以作为参考。第一组默认确定的基本约束引导出初始实时剂量计划的逆向计划(IP)。计划设计人员交互式地提出了附加的约束条件,以考虑其他参数。然后,逆向计划(IP)计算第二个优化方案。主要终点为Paddick适形性指数(PCI)。统计分析采用非劣效性试验设计。比较了覆盖范围、选择性指数和梯度指数、危及器官的受照剂量和12 Gy等剂量线体积。
结果
在逆向计划(IP)单次运行后,显示的PCI不低于“专家设计”的PCI。专家设计的和逆向设计(IP)的计划,中位覆盖指数分别为0.99和0.98,中位选择性指数分别为0.92和0.90,中位梯度指数分别为2.95和2.84,中位耳蜗轴受照剂量分别为2.83 Gy和2.86 Gy,中位靶点数目分别为14.31个和24.13个,和中位射线开启时间分别为46.20分钟和26.77分钟。在一些特定的情况下,为了有针对性地增加或减少这些约束,逆向计划(IP)的先进工具被用来对总体的(高选择性)或局部添加新的约束生成第二次运行。
结论
这些初步结果表明,这种基于“高效凸面优化算法”的新型逆向计划(IP)方法,称为IntuitivePlan®(直观计划),提供了高质量的实时剂量计划,具有良好的覆盖率、选择性和梯度指标,并优化了射线束开启时间。如果这里的新的逆向计划(IP)评估能够实时与有广泛的放射外科经验的专家治疗计划的质量竞争,可能会让经验有限或没有经验新的计划者/ 放射外科医生立即向患者提供优质GKRS治疗良性和恶性病变。
介绍
当Lars Leksell教授在1951年提出放射外科(RS)的概念时,这个概念是指在单次治疗中,对一个小的重要位置的颅内体积进行高剂量的放射治疗。经过几次尝试后,发明的伽玛刀(GK)使这一技术在临床上成为可能。GK是一种特殊的立体定向设备,能够以非常高的精度和准确性安全地照射单次高剂量的辐射,同时保持照射到周围组织的剂量非常低。用这种方法,放射外科(RS)的疗效取决于对整个靶区的覆盖。使用的剂量是按符合靶区外围的等剂量线处方的等于或高于“最低有效剂量(minimum efficient dose)”。放射治疗试图通过分割来保护靶区周围的正常组织。然而,在没有分割的情况下,能让放射外科安全的是它能够限制非靶区组织受照等于或高于处方剂量的剂量(选择性)。此外,还可以评估治疗方案的周边梯度的陡峭度。这些客观测量具有通用性,易于理解,易于计算。Ian Paddick提出了一种结合了覆盖率和选择性的简洁的放射外科指数,这是评估放射外科剂量计划在多大程度上符合放射外科的两个基本目标的简单有效的方法。
在临床实践中,当靶体积(TV)被确定时,(在GK的情况下)治疗计划的制定由操作者使用多个不同大小、权重和立体定向坐标的等中心来执行。(瑞典Elekta仪器公司)Perfxion和ICON型伽玛刀 ,每个扇区的24束射线束的大小可以变化或可以被遮挡。经过多年的实践,放射外科专家已经具备了快速进行高覆盖率和高选择性剂量计划的能力。但是,由于这方面的学习曲线,剂量计划的质量在很大程度上取决于计划者的专业知识。因此,自动逆向剂量计划可以让新进入放射外科领域的人立即制定出高质量的剂量计划。到目前为止,与专家的计划相比,逆向剂量计划的质量较差。为了实时提供高质量的剂量计划,一种基于“高效凸优化算法”的首创的逆向规划(IP)方法被开发出来。为了评估这种新方法在最具挑战性的放射外科指征中的表现,我们在一系列前庭神经鞘瘤(VS)患者中组织了一项前瞻性比较试验。
材料和方法
患者纳入和伦理委员会
在2017年12月14日至2019年2月21日期间,我们招募了86例患者,其中20例 Koos分级为I级的前庭神经鞘瘤(VS.),33例II级患者,17例III级患者,15例IV级患者。86例患者中35例有功能性听力,2例曾做过手术。所有患者都按照我们之前描述的标准方法进行GKRS治疗。对所有患者用于治疗计划的立体定向图像设置都是一样的。由第一作者创建的治疗计划作为参考。治疗计划(包括图像和感兴趣的区域)从Leksell GammaPlan (LGP)输出到LGK PerfexionTM和LGK ICONTM的LINUX工作站运行逆向计划(IP)。通过LGP的“输出DICOM窗口”和“患者管理”窗口,将DICOM式的立体定向图像和LGP格式的治疗方案导出到U盘上。使用完全集成的逆向计划(IP)系统(Intuitive Plan v1.0, Intuitive Therapeutics, Saint- Sulpice, Switzerland)在工作站设置剂量限制(处方剂量和危及器官最大剂量)。用户的唯一输入包括确定哪些结构(GammaPlan上预先确定的感兴趣区域)必须用作靶区结构和危险结构,以及设定处方剂量。由瑞士洛桑联邦理工学院信号处理实验室(LTS5)首创开发的IP凸面框架的一般原理在Levivier等人最近的一篇论文中得到了很好的描述。由计划者确定的约束指导IP进行初始实时剂量计划。如果专家需要考虑IP第一次运行时没有预先确定的额外约束,他/她可以交互式地修改它们,以优化计划,然后由IP计算第二个优化计划。根据试验设计,所有Paddick适形性指数低于0.85的计划都要进行第二次预设,以提高选择性,无论该计划是否被专家认为是适合临床的。使用特定工具(球形工具)增加或减少局部约束,以能在IP软件上重塑这些局部约束(例如,故意在前庭神经鞘瘤(VS)后方已知没有神经处创建较低的选择性,或在脑池前面面神经所在处提高选择性)。
计算最佳治疗方案;将结果显示出来,并创建一个允许在LGP中导入该剂量计划的文本文件并记录在u盘上(图1),然后使用“靶点”窗口的导入按钮从u盘导入IP生成的剂量计划。因此,通过直方图生成将专家的方案与新导入的IP方案进行比较。使用IP获得的计划重新计算,并在必要时重新将其导入LGP。在专家和IP生成的计划(运行1和运行2)中比较Paddick适形性指数(主要终点)、覆盖率、选择性指数和梯度指数、危及器官受照剂量和12 Gy等剂量线体积。统计分析基于非劣效性试验设计。这项研究是根据良好临床实践和世界医学协会关于知情同意和保护人类患者权利的赫尔辛基宣言(以及其他相关国际准则)进行的。研究的细节已与每位患者进行了讨论,并在进行非干预性研究(NIS)相关程序前获得了所有患者的书面知情同意。以法语向患者提供知情同意书,并以患者能够理解的方式解释信息。签字并注明日期的同意书由调查员保留,作为NIS记录的一部分。一份签字并注明日期的同意书副本发给每位患者。该研究由Intuitive Therapeutics的研究基金支持,但作者与Intuitive Therapeutics没有利益冲突,也对产品的商业化不感兴趣。
图1听力良好的左侧Koos III级前庭神经鞘瘤的剂量计划示例(Gardner Robertson 2级)。显示在IntuitivePlan工作站上,根据Leksell GammaPlan软件上绘制的靶体积(TV)和耳蜗轴自动生成剂量计划。
伦理委员会于2017年11月11日批准了本研究,其原始名称为法语:Protocole d evaluation d un algorithme de planification pour la radiochirurgie par Gamma Knife (SPEED),注册号为2017- a02753 -50 (NTC03520829)。这是一项非干预性、单中心、前瞻性观察性研究。所有患者都根据专家制定的治疗方案进行治疗。
结果测量的定义
比较的主要标准是Paddick适形性指数。比较的二级标准是几个额外的参数:覆盖指数、选择性指数、梯度指数、危险结构受照的最大/最小平均剂量、剂量在靶体积中的分布、射线开启时间、总治疗时间(在等源活性下)和执行治疗计划所需的时间。
指数的定义:Paddick适形性指数定义为TVPIV2/TV*PIV。覆盖指数定义为PIVTV/TV,选择性指数定义为PIVTV/PIV。梯度指数定义为一半的处方等剂量对应的等剂量体积除以处方等剂量体积的比值(the ratio of the volume of the isodose corresponding to half the prescription isodose divided by the volume of the prescription isodose)。
纳入和排除标准
纳入附属于社会保障计划(affiliated with a social protection scheme),已了解研究信息的年龄大于18岁的男性或女性患者,接受GKRS治疗。所有人都能提供书面知情同意书。排除对MRI有禁忌证的患者、既往有头部放射治疗史的患者、孕妇或哺乳期妇女、积极参加另一项试验或在前一项临床试验排除期的患者、脆弱的人群(未成年人、受保护的成人)或无法表达其同意的成年人。
主要终点和次要终点
本研究的主要终点是比较评价逆向计划软件自动生成的治疗计划与由一名在GKRS领域有27年经验的放射外科医生,他(第一作者)已制定并交付了超过15,000个剂量计划和放射外科干预,所制作的治疗计划的质量。
目的是通过比较各自的Paddick适形性指标,至少表明这种新方法与专家用户的非劣效性。这个指数的值在0到1之间连续,0是最坏的情况,1是理想的解决方案。为了确定每种病变所需的样本量,使用专家用户已经完成的治疗进行了回顾性的试验阶段研究(a pilot phase study)。这个试验阶段允许我们识别指数值和差异可变性之间可以预期的差异。
在这个试点阶段期间,选择要整合的病例数取决于在第一个病例上获得的差异的同质性。试点阶段包括的病例数为30例。基于这些值,我们能够确定样本的大小,允许我们从统计上测试非劣效性,甚至是这种新方法的优越性。本研究的样本量是根据前期评估的Paddick适形性指数特征和变异来评估的。
结果
逆向计划(IP)制定的Paddick适形性指数(表1和2;(完整数据见表1和表2)与专家提出的数据相比没有显著的差距(完整数据见表3),分别为第一次运行的逆向计划(IP)的Paddick适形性指数0.898 ±0.076;专家计划的0.881±0.066。这表明生成的IP计划的Paddick适形性指数没有明显不如专家创建的计划,也就是说IP的平均Paddick适形性指数与专家的计划相差不如最多(max)0.01单位。我们发现这个软件很好用。
表1第一次运行后的默认结果。由专家和IntuitivePlan v1.0(默认参数/第一次运行)定义的计划提供了平均值和标准偏差。每个参数的Student t检验显著性值也被列出。适形性指数均值差为0.009(0.978-0.987),95%置信水平为(-0.014;-0.004): p <0.0001。
表2在第二次运行后更新的结果。在使用默认参数组处理所有的86例后,18例Paddick适形性指数低于0.85。这些情况在第二次运行中使用一组预定义的新参数重新处理。下表中,使用改进后的数据与专家计划进行了统计分析。平均Paddick适形性指数和选择性指数均有提高,可以忽略对梯度指数的影响。
表3 Paddick适形性指数统计分析如下表所示。分组t检验结果显示p值= 0.0058。这表明,在Paddick适形性指数方面,使用IntuitivePlan v1.0进行计划的用户在统计上不低于专家用户。intuveplan v1.0的Paddick适形性指标与第一次运行后专家所做的计划没有显著差异。
第一次运行算法
在对IP进行首次运行后(表1),配对t检验显示,选择性指数和梯度指数没有统计学上的显著差异,但专家计划的覆盖率指数有优势(p = 0.0192,分组t检验)。在第一次测试后,尽管使用了更大的平均靶点数(14.83 vs 23.82),但IP治疗计划的平均射线束开启时间明显短于专家计划的(27.69分钟vs 49.85分钟)。
第二次运行算法
第一次运行后,有18例Paddick适形性指数(<0.85),不完全符合计划的标准,并对所有这批(PC<0.85)18例有异常形状的肿瘤患者(如图2侵犯岩骨的神经鞘瘤)设置第二次IP的运行(表2)。
图2一例Paddick适形性指数(PCI )<0.85的神经鞘瘤;因侵犯岩骨VII神经的骨性管道的第一、第二部分而出现复杂的形态学表现。
在这第二次运行中,系统被设置为提高选择性。在第二次运行后,显示PCI值分布的箱线图显示,该指标在少数的离群值上有了显著的改善(图3)。实际上,在第二次运行后,对PCI的分析显示,专家的计划中有更多的低指标离群值。,在第二次运行后对覆盖指数、选择性和梯度指数值的分布状况的分析显示,对一些PCI较低的离群值的修正导致改善选择性指数而没有影响到覆盖率和梯度指数(图4)。专家计划的平均的靶点数是14.83,而第一次和第二次运行的靶点数分别为23.82和24.31。射线束开启的时间不受第二运行的影响。而且仍然明显短于专家创建的计划的射线束开启时间(图5)。专家的平均计划时间为12分钟,相比IP平均计划时间2.5分钟较长。即使在添加了LGP和IP之间的数据传输时间(3-5分钟)之后,利用IP开发计划所需的时间仍然短得多(不到一半)。
图3专家方案、逆向计划的第一方案、第二方案的Paddick适形性指数值的盒状图。由于第二次运行,低PI的少数离群值显著改善。需要注意的是,在专家的计划中也有一些低PI的异常值。
图4第二次试验后的覆盖率、选择性指数和梯度指数箱形图分析。这些箱形图表明,第二次试验提高了Paddick适形性指数,主要是通过提高选择性。第一次运行出现在名为Speed的下面,第二次出现在名为Updated的下面。
图5显示射线开启时间(BOT)持续时间分布的箱形图,并以表格形式显示三个计划各自的靶点数目。逆向计划的第二次运行虽然提高了Paddick适形性指数和选择性指数,但不影响射线束的开启时间,与专家相比,逆向计划的射线束开启时间仍然较短。该表显示专家的、逆向计划的第一次运行和逆向计划的第二次运行的靶点数。尽管有更多的靶点数,但射线束开启时间却短得多。y轴表示射线束开启时间(BOT)。
当逆向计划的Paddick适形性指标较好时,我们单独对计划进行了重新分析。专家对这些病例的解释是故意选择不去追求基于特定解剖或临床参数的最佳指标(图6描述了一个病例的图示)。
图6专家最差方案与逆向计划方案对比的病例说明。在这种情况下,由逆向计划系统(IP)生成的计划的Paddick适形性指数(PCI)虽然较低(0.73),但优于专家的Paddick适形性指数(0.60)。对于患有管内段前庭神经鞘瘤和无功能性听力的患者,专家的选择是有意在不存在面神经损伤风险的骨的后部重叠(以降低选择性和PCI为代价)。旨在改善PCI的第二次IP测试(作为研究方案的主要终点)在此并不有益,PCI只有轻微的改善,但有一个更糟糕的梯度。在这种情况下,专家的计划更简单(只有一个靶点),更快,可能比IP的计划更实用。然而,IP允许计划者通过放松约束来调整计划,并且由于这种交互作用使得计划更简单更快,故意降低了后部的选择性。
讨论
目前,GKRS治疗计划的制定过程很大程度上依赖于人的专业知识水平,导致治疗计划的内在质量和提供给患者的医疗质量存在很大的异质性。按我们团队的经验现有的逆向计划系统,虽然在最近几年取得了很大的进展,这些产品的质量往往低于专家所达到的质量。
通常,经验丰富的剂量计划设计者将主要作用在等中心位置的坐标,准直器逐个扇区的大小尺寸,以及每个等中心的辐照时间上起作用。理论上,这些变量的组合提供了数以百万计的组合,其多样性远远超过人类大脑的计算能力。因此,剂量计划设计者总是通过复制有限数量的根据经验的解决方案来使用很小一部分的可能的模式谱。
这里评估的新的数学算法可以在很短的时间内自动测试所有组合的可能性,并迅速集中于最符合操作者定义的临床、解剖和剂量学目标的解决方案(即由算法提供的最佳数学解决方案)。该系统的快速处理还能让操作员修改约束条件,并实时改进建议的结果。系统提供特定的工具(球面工具)来增加或减少局部约束。在随后的运行过程中,该软件允许在非最佳覆盖下准备计划,通过接受处方剂量的扩展到临床静默的相邻体积(例如,在前庭神经鞘瘤的后侧,因为面神经走行在前面,耳蜗神经走行在前下方)。
该算法性能的实际演示甚至为经验不足的用户提供了能力,以制定高质量的治疗计划,优化放射外科治疗结果的疗效/毒性比,以造福患者。
这项研究的主要目的是对由该算法产生的计划的质量与一名专家所产生的计划的质量作比较评价,该专家已执行了15000多个剂量学计划和放射外科干预。本研究结果表明,该IP计划的平均Paddick适形性指数并不逊于专家制定的计划。
然而,这项工作也有局限性。我们必须记住,一个好的剂量计划不只是一条具有良好梯度的很好地拟合在靶区界限线上的处方等剂量线。
首先,基于具体事务MR序列和这些图像的QA质量的实现靶区轮廓勾画的方式,都可能对治疗计划的真正临床质量产生重大影响。换句话说,如果临床医生没有充分的解剖知识,没有对不同的MR序列充分的理解,没有对畸变作评估或不恰当选择使用的MR序列的,从而对靶体积(TV)定义不准,一个有良好的参数的精密计划只不过是一个谎言。
其次,专家计划者整合了个体患者的临床和背景信息,以及局部解剖特异性(自愿降低选择性等),并可能根据相关的临床、功能或解剖原因,决定改变靶内或靶外剂量分布的形状。在自动生成“高级默认计划”之后,IP的一个优点是它能够根据特定的需求对计划进行微调。在这个系列中,大多数是未手术的而不是术后病例。术后的病例通常没有更多的听力功能,这对人类和计算机规划者来说都是一个较小的挑战。系统的交互性允许集成更多的约束(通过操作等剂量线,第二次运行具有更高的选择性或局部约束)。
记住这一点,这个算法,即使在默认模式,平均Paddick适形性指数为0.8807,平均覆盖率指数为0.98,平均选择性指数是0.90,平均梯度指数是2.84,显然比绝大多数临床医生放射外科治疗实践所执行的要好。例如,在前庭神经鞘瘤的系列研究中,对由专家设计的GKRS计划, Massager等人发现平均Paddick适形性指数为0.7,在Wowra等人的研究系列中,平均Paddick适形性指数为0.68(0.26 -0.84)。
逆向计划(IP)提供的剂量计划不次于由一个最有经验的放射外科专家在很短的时间内制定的剂量计划。使用这种IP方法,有可能显著提高脑部放射外科领域的最佳实践水平。
显著减少的治疗时间可能导致显著更高的生物效应剂量(BED)。考虑到以前确定处方剂量的经验,这可能会有影响。
而且,在我们看来,对这个IP,不仅是希望立即制作出高质量计划的新手感兴趣的,专家也感兴趣。专家们可以利用它来缩短计划时间和射线开启时间,同时保持与系统交互的能力,并实时地用新的约束条件交互式地挑战系统。尽管使用了较多数目的等中心点,IP提出的方案比专家提出的实施照射(即,射线开启时间和治疗时间)要快得多(,这是因为IP与专家不同,很少使用射线束通道的阻挡)。对该系统产生的计划解决方案的分析表明,该系统有能力提出策略,而这些战略并非人类专家自发设想的,该系统具有创造创新计划的方法(即共焦点杂交[confocal hybridation]和扇区阻挡[sector blocking])的惊人能力。因此,即使是专家也可以从系统中“立竿见影地(out of the box)”学习到策略。
结论
结果表明,IntuitivePlan v1.0为前庭神经鞘瘤(VS)患者提供了高质量的实时GKRS方案,具有良好的覆盖率、选择性和梯度指数,同时显著减少了射线束开启时间。计划和治疗时间均被缩短。使用默认参数计算的计划已经是高度可接受的,并且与专家的计划相比,在Paddick适形性指数方面,已经证明了非劣效性。在选定的患者中,第二次重复(second iteration),无论是否有可能直接和直观地操作等剂量线,允许计划在其他质量指标方面变得更有说服力(with or without the possibility to directly and intuitivelymanipulate isodose lines, allowed plans to become even more convincing with regard to the other quality indicators.)。