免疫检查点抑制剂的临床挑战

前言

现代免疫疗法作为癌症治疗的一个新里程碑,带来了革命性的改变,以前由于缺乏治疗选择而受到限制的许多肿瘤类型得到了改善。这反映在随后的一系列免疫肿瘤学(IO)药物的获批,首先是单一疗法,后来是联合用药,甚至是一种未知组织的适应症。在实体瘤中,大多数成功的案例都是通过免疫检查点抑制剂(ICIs)实现的,但是情况正在迅速发展,不同的作用机制(MoA)已经存在或很可能很快进入临床领域。溶瘤病毒,如talimogene laherparepvec或自体细胞免疫制剂sipuleucelT已分别被美国食品和药物管理局(FDA)批准用于黑色素瘤和前列腺癌。此外,还有一些激动人心的药物正在研究开发中,如双特异性药物、激动剂IOs或过继细胞疗法等,这些药物显示出了极具前景的初步数据。然而,免疫治疗的另一面也逐步显现,需要解决。一方面,ICIs带来的毒性和疗效的挑战,与传统的化疗或靶向治疗大不相同。另一方面,目前大多数的临床试验仅限于少数肿瘤类型,而且缺乏创新的靶点。下面我们从多个不同的角度来讨论这些局限性。

IO领域耗竭的迹象

不到十年的时间里,肿瘤领域里FDA批准了57个新的IO药物针对 17个实体肿瘤适应症。其中,6种作用机理相似的PD-1/PD-L1抗体占到了IO药物批准的82%。在临床研究中,正在开发的活性药物的数量从2030增加到3876种,在过去两年里增加了91%。同样,在同一时期,特定的IO靶标增加了77%(2017年为265个,2019年为469个),尽管五个最常被成药的靶标中有四个并不新颖。

尽管数字很有希望,但在过去两年中,人们注意到批准数量有所下降,主要是在实体瘤方面。2019年没有批准具有新型MoA的新药,看上去在PD-1/PD-L1领域可能会出现稳定状态。此外,在5166项正在进行的临床试验中,66%是T细胞调节剂,而它仅占研发中各类活性药物的6%。这些数据不仅意味着该领域的饱和,还意味着在药物开发方面的低风险战略投资,在少数药物中进行高密度的临床试验。关于PD-1/PD-L1轴的发展,在过去的4年里,活跃的临床试验数量增加了20倍。然而,这与患者招募率并不匹配,因为据报道,在同一时期PD-1/PD-L1联合试验中,患者纳入率下降了70%,这可能部分地与患者在一般环境下可以更容易地获得ICIs有关。从整体分析来看,IO药物的开发存在一些饱和信号:临床上测试的创新MOA相对较少,审批处于停滞状态,一些肿瘤适应症和靶点已经存在饱和。

挑战1-抗肿瘤活性

为了使研究药物获得成功,试验设计需要考虑到与MoA相关的药物特性、药代动力学(PK)、药效学(PD)以及和临床行为相关的有意义的终点。非最优的临床试验设计可能会忽略一些问题,而无法提供药物潜在的实际效能的证据。在IO药物开发中,这些特征更加明显,其特征包括不同的放射影像学模式、疗效测量终点和具有挑战性的不良事件。

尽管ICIs的优点在于它能够实现长期甚至完全的响应,但事实上,大多数患者并没有从这些治疗中获益。当假进展(PP)或过度进展(HP)的概念出现时,医生确定患者是否正因IO药物而受到真正的临床影响非常具有挑战性,这与传统肿瘤治疗的经典模式完全不同。

PP定义为肿瘤病变在最初的进展后消退,这是由于在发生瞬时免疫细胞肿瘤浸润时人为增加了肿瘤负荷。尽管这些病例五花八门,但报告的PP发病率通常低于10%。而在黑色素瘤或尿路上皮癌中,PP比率可分别达到8.3%或9.1%,而其他肿瘤类型,如头颈部鳞状细胞癌,则低至1.3%,这意味着大多数具有影像学疾病进展的患者将无法从治疗中获益。然而,真正的PP患者可能有更好的机会获得药物的长期疗效,因此在第一次肿瘤进展之后是否继续治疗的可能性,需要纳入新的放射影像学评估标准。除了放射影像学标准外,目前还没有明确的PP预测因子;循环肿瘤DNA可能成为一种有用的工具,但仍需在更大的人群中进行验证。

相反,HP的范围在4%到29%之间,如此显著的变异性是由于到目前为止仍缺乏一个标准化的定义。HP发生在疾病发展更快,即加速的亚组患者中,这是由于IO药物的MoA导致无进展生存期(PFS)和总生存期(OS)较差。人们从肿瘤生长动力学不同的角度对HP的定义进行了考量:一些研究根据RECIST评估了最大直径总和的变化,而其他研究评估了肿瘤体积的演变以及小于2个月的治疗失败的时间。在这方面,将ICI相关的HP与进展迅速的肿瘤区分开来是很重要的。因此,通过IO药物治疗前的影像学检查对肿瘤生长动力学的评估,从而对治疗前和治疗中的差异动力学进行比较,这似乎是当前必须考虑的问题。与PP相似,到目前为止还没有发现预测因素,其生物学原理仍不确定。年龄越大、转移部位数量越多或分子改变(如MDM2/MDM4扩增或表皮生长因子受体)可能与HP有关。最后,IO也可以看到响应分离,即不同部位的病变发生不同的响应,类似于化疗或靶向治疗的混合反应。据报道,非小细胞肺癌(NSCLC)患者的发生率为7.5%,与进展性疾病相比预后更好。

除了常规的放射影像学评估外,识别可靠的标志物是非常必要的,以便识别IO治疗患者的肿瘤生物学行为。不同的状态潜藏着重要的临床意义,假进展的患者可能在ICIs的治疗中获得显著的益处,而过度进展的患者需要尽早确定,以便能够立即转为其他治疗。

挑战2-IO药物的临床终点

以前有人指出,用ICI药物获得的生存曲线与常规治疗的表现不同。虽然斜率差别不大,甚至在与化疗或靶向药物的对比研究中可以观察到IO药物的早期有害作用或完全无效,但这些药物的最大效益在于曲线的尾部。在长期终点,曲线的尾部变平,识别出具有持久反应的生存平台,这就是这些IO药物的独特之处。多个随访时间较长的研究成功地验证了这一概念。然而,仍然有因为终点选择不当而失败的可能,IMvigor211研究了atezolizumab对晚期尿路上皮癌患者的二线治疗,与化疗相比,OS在曲线交叉后表现出对atezolizumab的早期不利影响,如下图所示。

尽管事实上,atezolizumab在PD-L1过度表达的患者中并没有显示出OS优势,但有一些明显的迹象表明其优越的抗肿瘤特性:如ICI组的活跃患者数量更多,或者atezolizumab组的反应持续时间更长(中位数15.9个月[95% CI 10.4-未达到] vs 8.3个月[5.6-13.2])。其他主要终点是否会改变IMvigor211试验的结局,目前尚不确定,但这反映出选择适当的终点以最大限度地发挥药物潜力的重要性。临床试验中的疗效终点需要捕捉IO药物的这些更长的活跃时间,否则药物的益处可能被低估。

大多数用于化疗或靶向治疗评估的终点,如OS中位数、PFS中位数和总有效率(ORR),在测量无治疗意图的治疗时是准确的。由于它们的MoA,这些药物会迅速缩小肿瘤的大小,但最终患者会随着时间的推移而进展。OS被认为是肿瘤学试验的经典金标准。中位OS可以对生存率做初步的评估,然而,这并不能很好地显示IO药物的长期效益,m-OS不会考虑患者在达到m-OS后的生存率,它忽略了生存曲线的尾部。此外,当治疗显示治疗效果随时间变化时,在IO研究中更容易发生比例风险的偏离,并可能导致临床试验不足或得出误导性结论。

需要其他替代指标来评估曲线的尾部。考虑到用Cox模型获得的比例风险通常与IO结果相违背,其他非比例模型(如加速失效时间模型)可以预测更好的治疗结果。此外,还可以通过Kaplan-Meier曲线下面积(AUC)来补充平均OS。最后,长期时间点的里程碑生存率已成为一个标准,因为它们可以更好地识别随时间变化的曲线之间的差异。例如,CheckMate 067治疗未成年黑色素瘤患者的试验显示,以5年时的OS率衡量,与ipilimumab相比,nivolumab-ipilimumab的生存率明显受益(HR 0.52;95% CI 0.42–0.64)。

与OS一致,PFS或无疾病生存期(DFS)适用于评估快速控制肿瘤生长的药物活性,但不适用于在疾病控制方面的影响可能仅随时间推移而显现的治疗方法。对于ICI而言,PFS或DFS可能低估了在一小部分但仍然相关的患者中具有长期稳定疾病或非常规反应的药物活性。同样,在某些时间点,具有里程碑意义的PFS/DFS或PFS/DFS比率可以更好地表现这些特征,例如,CheckMate 214试验比较了nivolumab-ipilimumab组合与sunitinib对原始肾细胞癌的疗效。在这种情况下,中位PFS没有显著性的差异,但是在更长的随访期内,与sunitinib相比,IO联合用药组的PFS比率显示了显著提高的生存率(30个月时为28%对18%)。

最后,无治疗生存期的新概念是一个理想的癌症治疗终点,因为它考量的是长期存活的无进展且无需进一步治疗的患者。在CheckMate 067试验中,52%的联合治疗组存活5年的患者中有74%是无需治疗的。因为这些患者从ICIs中获得最大的益处,这个非常相关的终点应该纳入到这类试验中。要考虑的其他效益指标包括生活质量测试或开始下一次治疗的时间,需要认真考量患者的福利,而不仅仅是平均的PFS和OS。

挑战3-免疫相关不良事件

IO药物治疗通常会产生与传统肿瘤药物不同的副作用,其起效、持续时间和严重程度也不同。尽管免疫相关不良事件(irAEs)因IO药物的类型不同而有所不同,但ICIs有共同的特点。首先,ICI-irAEs倾向于器官特异性,而不是同时累及患者的多个器官。第二,毒性发作有规律性地延迟:ipilimumab几乎持续到第四周,而nivolumab则是第十周,甚至在某些情况下持续到停止治疗之后。第三,ICI毒性与剂量没有明显的相关性,因此,剂量减少不会阻止其再次发生。正因为如此,免疫毒性常常需要永久性的停止治疗,尤其是在联合用药的治疗中。例如,在黑色素瘤患者中,使用nivolumab和ipilimumab联合用药与单独使用nivolumab和ipilimumab相比,治疗相关的3级或4级不良事件分别为59%、23%和28%;分别有42%、13%和15%的患者因任何程度的治疗相关副作用而需要停止治疗。与ICI相关的不良事件在辅助治疗中尤其具有挑战性,因为延迟性,有时严重的毒性反应可能会导致患者的永久性损伤,而这些患者可能已经通过手术治愈了肿瘤。

其他药物如激动剂或双特异性抗体具有不同的毒性特征,在治疗后几分钟到几小时内更容易导致急性细胞因子释放综合征(CRS)。尽管CRS表现为发热、僵硬和寒战,但严重病例包括低血压、缺氧和危及生命的后果。剂量或输注速率的降低可能有助于这些药物的毒性控制。一般来说,与其他类型的药物一样,IO药物相关副作用的有效管理依赖于对症状的早期识别和作为类固醇或其他免疫抑制剂的迅速应用,而不仅仅是缓解症状的药物。此外,中和的抑制剂,如类固醇,需要给予几个月,并可能产生额外的副作用。

那么,临床试验是否能够用标准的不良事件通用术语标准(CTCAE)分级来描述这些特殊的IO药物特征,这里需要提出疑问。一方面,迟发毒性可能出现在剂量限制毒性(DLT)期的窗口之外,因此不考虑剂量爬升。另一方面,根据CTCAE,中度或2级毒性可能会影响患者的生活质量,从而限制给药,甚至导致停药,因此应将其归为重度毒性。例如,大多数国际指南都建议开始使用类固醇治疗2级肺炎、结肠炎,甚至皮疹,这些可能导致暂时停止治疗或严重毒性。此外,有必要建立标准化客观的irAE定义,以便进行同质分类,避免对药物毒性的误解。目前,在某些毒性如CRS或输液相关反应(IRR)的情况下,严重程度的标签部分取决于医生如何处理伴随的缺氧或低血压,而不是客观可测量的症状。在研究中,这些研究者间的差异可能导致药物之间耐受性比较的显著差异。在CheckMate 214试验中,总体毒性情况似乎有利于IO药物组合,但另一方面,该组的停药率也较高(22%对12%),因此高达三分之一的患者因irAEs需要服用高剂量类固醇。

最后,可能需要将危及生命的ICI诱导的过度进展纳入CTCAE标准,因为它对患者有严重的后果。如果进一步证明其与ICI给药相关的机制,并且会对这些IO药物的总体耐受性产生影响,则需要在试验中报告这些药物的副作用。

挑战4-剂量和开发计划

传统上,抗癌疗法已在具有小鼠免疫系统的同基因小鼠模型或允许植入人类异种移植物的免疫缺陷小鼠中进行了探索。显然,这种方法不适合IO药物治疗,因为老鼠缺乏人体免疫系统。开发带有人类敲除基因或人类功能性造血细胞的新型“人源化”小鼠模型,将允许对临床前人类免疫系统中的IO药物进行研究,尽管这些模型的复杂性和成本仍然会阻碍它们的全面实施。为了弥补临床前信息的不足,I期临床试验需要包括广泛的PK/PD终点和生物标记物的子研究,以便更好地了解肿瘤微环境中的药物作用及其药理特性。通过从临床试验中获取科学见解并将其应用于临床前模型的逆向转移也有帮助,这一概念尤其适用于新辅助的ICI研究,因为治疗后的肿瘤切除可能有助于识别反应的预测性生物标志物。在这种情况下,在黑色素瘤、非小细胞肺癌和胶质母细胞瘤的临床试验中观察到了令人鼓舞的结果。

强有力的PD终点结果,结合临床反应和主要毒性评估,最终将确定I期试验中的推荐剂量(RD)。传统上,药物剂量爬升依赖于在第一个治疗周期或DLT期间发生的严重毒性,但这可能不适合IO。由于irAEs发病较晚,在一个标准的单周期DLT周期内可能无法捕捉到这些毒性,因此真正的毒性可能被低估。此外,长期、反复或累积的中度毒性可能导致患者药物不耐受,因此也应被视为DLT。同样的情况也发生在过度进展,它是一种危及生命的疾病,因此从定义上讲就是DLT。因此,DLT的概念应该发展到包括在第一个周期之后观察到的真正的“剂量限制”毒性,和与导致生活质量恶化和治疗中止的非严重毒性。因为这里的大多数严重毒性与剂量无关,因此,我们应该寻找治疗限制毒性率,即,由于耐受性差而不能继续给药的患者百分比,而不是DLT的比率。

为此,剂量估算设计可以采用一些可以捕捉免疫治疗的独特特征的模型,如贝叶斯无缝模型,因为信息是通过考虑每个患者治疗的三个结果获得的:反应、毒性和疗效。数据的积累允许根据更新模型的估计值对患者进行适应性给药,贝叶斯设计允许决策者考虑试验中产生的所有可用数据。

与此相一致,大多数ICI剂量发现研究都无法确定最大耐受剂量(MTD)或RD,这可能更适合称为“剂量范围”研究。在nivolumab一期研究中,研究了不同肿瘤类型的剂量范围为0.1到10.0mg/kg(q2w)。对于56天的DLT周期,无法确定MTD。同样,对于pembrolizumab、Atozolizumab和durvalumab的其他I期研究也无法建立MTD,所有这些研究的DLT周期都比nivolumab试验短,如下表所示。

有趣的是,在这些试验中,毒性和活性似乎都不是剂量依赖或成比例的。在不同剂量水平下,约有10%-14%的患者出现PD-1/PD-L1药物的毒性,使用nivolumab和pembrolizumab的ORR为20%-40%。

当未达到MTD时,选择RD可能具有挑战性。在nivolumab研究中,在低至0.1 mg/kg q2w的剂量下就表现出活性和最大受体占有率,约占3mg/kg q2w RD的3%。同样,0.1mg/kg下的稳态谷浓度(Cminss)比nivolumab第二个RD 480mg q4w的Cminss小了18倍。因此,目前的RDs可能已经不必要地高于预期的受体占有率和ICI的疗效。

事实上,剂量并不总是与血浆暴露相关,因为这些药物的清除率是高度可变的。随着肿瘤缩小,清除率可以降低达40%;而随着状态恶化、抗抗体生成以及性别的不同,清除率可能会增加,从而导致暴露量的显著变化。因此,有人建议测量血浆暴露量可能比标准剂量更好地与抗肿瘤活性相关。在使用ipilimumab进行的暴露量-反应回顾性分析中,发现较高剂量的CTLA-4抑制剂产生更多的Cminss,与更好的肿瘤反应和更长的生存期相关,但也与较高的IRAE发生率有关。在使用nivolumab治疗的非小细胞肺癌患者中也有类似的暴露量-反应关系,其中较高的Cminss与更好的肿瘤反应相关。最后,一项使用真实和模拟AUC的研究表明,剂量降低25%的pembrolizumab达到了与FDA批准的两种推荐剂量相似的暴露量。进一步的研究需要解决个体患者根据目标药物暴露量调整剂量是否会比标准剂量获得更好的结果,这意味着节省成本,方便病人,并有可能通过严格的治疗指标控制来改善活性和毒性。

同样的,患者继续接受ICI治疗所需的最佳时间长度仍不清楚。对于长期缓解的患者,停止治疗可能是一个可行的选择。然而,很少有试验将固定持续时间的ICIs与其持续给药进行比较,直到疾病进展或不可接受的毒性。其中之一是对非小细胞肺癌患者进行的CheckMate 153研究,结果对那些接受1年ICI治疗而非持续治疗直至疾病进展的患者不利。为了回答这样一个重要的实际问题,还需要进一步的随机试验来探索早期ICI停止、再激发或生物标记物和放射影像学驱动的“开关”ICI剂量。

小结

IO领域中已经出现一些泡沫的信号,需要进行一些改变,以最大限度地提高有效IO药物开发的临床试验设计。这些方法学的改进应该是成功的第二代IO药物的基础,以适应和获取他们关于包括活性和不良反应的真实临床特征。转向更合理的、基于生物学的试验,研究与IO特异性终点相关的有意义的生物标志物,可能会改善临床结果。这些临床试验需要从最初的病人那里得到充分的信息,必须包括广泛的PKs、基线检查和治疗中的活检、短期和长期毒性和生存终点,以及回填队列,以应对临床前模型中信息的缺乏。

ICIs仍有一些其他问题有待回答。患者继续接受治疗所需的时间尚不清楚。与其仅仅选择一个固定的时间,一个更合理的方法可能是在患者血液中找到抗肿瘤免疫系统激活的“PD信号”,以指导对进一步剂量的“通过/不通过”决定。在联合用药时,使用何种剂量以最大限度地提高药物效力也仍然是不确定的。在这种情况下,集成建模和仿真策略的新试验设计可能会有所帮助。最后,大数据和人工智能已经能够分析和理解细胞系中产生的大量基因组和蛋白质组数据,但它们将在临床试验中发挥何种作用仍有待观察。新的具有挑战性的药物正在出现,但它们需要更合理的开发来为我们的患者带来最好的机会。

参考文献:

1.ClinicalChallenges of Immune Checkpoint Inhibitors. Cancer Cell. 2020 Sep14;38(3):326-333.

(0)

相关推荐