近年来,随着对疾病、遗传学、药物发现和作用机制的深入了解,识别预后和预测因素在医学研究和个体化治疗中变得越来越重要,包括患者特征(如年龄、种族、性别或吸烟状态),疾病特征如(疾病分期或淋巴结状态),以及分子标志物(如HER2扩增、Kras突变)等。
然而,根据文献中报告的内容,区分某个“因子”(factor)是预后性还是预测性仍然困难重重。今天,跟大家翻译分享一篇2013年发表在J Thorac Oncol的经典文献《What a Clinician Ought to Know: Prognostic and Predictive Factors》,为临床医生提供区分预后和/或预测因素的简明指南。
本文讨论的预后和预测因素概念集中于RCT。然而,这些概念可类似地应用于观察性研究和其他研究。众所周知,开展一项随机临床试验(RCT)需要收集大量的患者基线数据。任何基线因素都可能具有预后性和/或预测性,例如年龄、性别、人种和疾病分期。在RCT中,仅基线特征会被研究者评估是否具有预后性和/或预测性。随时间推移发生变化的基线值,例如体能状态和前列腺抗原水平,在本文的范围之内;但是,基线后时间依赖性变化及其对结局的影响,则不在本文的范围之内。预后和预测因素可以帮助临床医生在何时开始、停止或改变治疗(预后因素),或为合适的患者量身定制治疗方案(预测因素)时做出明智决策。两者临床应用价值的总结见表1。在最简单的情况下,预后因素是在开始任何治疗前评估的变量。无论给予何种治疗,基于该因素的值(水平),临床医生可以预期患者可能有更好或更差的临床结局(生存或缓解)。例如,无论给予何种治疗,基线体能状态良好的患者预后优于体能状态较差的患者。在这种情况下,预后因素水平(良好体力状态)与患者结局(生存期)之间的关系并不取决于给予的具体治疗。而当治疗效应(如缓解率[RR])与因素水平(男性/女性)的关系,因给予的治疗不同而变化时,则该因素具有预测性。即,患者的因素水平(女性)与患者结局(RR)之间的关系取决于给予的具体治疗。某个因素可能对于特定研究终点是预后和/或预测性的,同时可能与其他终点无任何关系。此外,识别一个重要的预测因素可改变护理标准,由此在未来可能演变为预后因素。换句话说,对新治疗效果不佳的患者将接受其他治疗;从新治疗获益的患者类型则可能显示出预后效应。预后和预测因素之间的差异总结见表2。可以前瞻性(即,通过在方案和/或统计分析计划中预先指定该分析的假设检验)或回顾性(即,使用探索性分析生成假设)评估基线因素是否具有预后性。在设计良好的大型研究中,预先规定分析可通过随机、设盲、充分随访,使误差和偏倚最小化,从而可信度较高。常用的统计回归方法则取决于终点的类型。例如,对于至事件时间终点(如总生存期或无进展生存期),通常采用Cox回归;对于二元终点,采用logistic回归(如是否缓解);对于连续终点,如肿瘤大小的变化,则使用线性回归。流程图1说明了用于评估基线因素是否具有预后性和/或预测性的推论模型的常用方法;预先规定了推论模型,并使用方法控制多重检验。流程图2显示了用于评估预后和/或预测性基线因素的探索性模型构建的常用方法。以下示例讨论了假设结果,以说明预后和/或预测因素的不同组合。Tx A是对照组,Tx B是试验组。箭头的不同长度和/或方向指示预测因素;不同位置(长度和方向保持不变)指示预后因素。在该示例中,女性和男性接受Tx A治疗的RR为30%,接受Tx B治疗的RR为60%,治疗效应大小和幅度相同(改善30%)。此外,两种性别接受两种治疗的RR相同。在评估性别预后影响的回归模型中,性别因素的p值为0.75,支持性别不具有预后性。在该示例中,女性接受Tx A治疗的RR为30%,而接受Tx B治疗的RR为60%;男性接受Tx A治疗的RR为20%,接受Tx B治疗的RR为50%。男性和女性的治疗缓解差异均为30%,但男性的缓解率低于女性(Tx A分别为20%和30%,Tx B分别为50%和60%)。与女性相比,男性的较低缓解率表明性别是预后因素。此外,使用统计模型时,性别因素的p值为0.04,证实了性别的预后效应。但是,进行治疗-性别交互效应检验时,p值为0.65,这表明性别不是预测性的。在该示例中,女性在Tx A的RR为30%,而在Tx B为60%,相差30%。相比之下,男性在Tx A的RR为30%,而在Tx B上的为45%,相差仅15%。治疗效果的大小不同(RR的差异),表明存在定量相互作用。使用治疗-性别交互效应检验得出p值为0.025,这表明性别具有预测性,但非预后性,考虑到对照组的RR(Tx A)在不同性别间一致。在该示例中,与Tx A相比,女性在Tx B的RR同样提高了30%(60%对30%)。但是在男性中,Tx B相比Tx A的RR降低20%。因此,治疗效果的方向在不同性别之间发生改变,表明存在定性相互作用。统计模型证实了性别的预测效应,p值为0.001。例5:雌激素受体状态:预后性(正性),预测性(正性)在乳腺癌中,雌激素受体(ER)阳性的患者往往比ER阴性患者活得更长。既往研究显示,ER阳性乳腺癌的5年生存率为70%,ER阴性乳腺癌的5年生存率为 50%;统计分析证实了ER状态的预后价值,p值为0.02。其他试验也显示了相似的结果。在该示例中,ER阳性并接受Tx B治疗的患者5年生存率为80%,而接受Tx a治疗的患者为60%。相反,ER阴性并接受Tx B治疗的患者5年生存率为50%,而接受Tx a治疗的患者为40%。治疗-ER状态交互效应检验产生的p值为0.01,也支持ER状态的预测价值。上述假设结果表明,ER阳性同时具有预后性和预测性。例6:HER2受体状态:预后性(负性),预测性(正性)已知乳腺癌HER2受体状态与不良预后有关。各种假设试验表明,HER2既具有预后性又具有预测性。在该示例中,HER2阳性患者的预后相比HER2阴性对照组更差,提示负性预后效应。另一方面,定量相互作用显示,Tx B对HER2阴性和阳性患者均具有积极的效应,提示阳性预测效应(尽管与HER2阴性相比,HER2阳性患者接受Tx B的治疗改善效果较小)。在局部晚期癌症中,已证实年龄增长可增加癌症复发的风险。在该示例中,接受Tx A治疗的患者年龄每增加5岁(从40岁开始),复发率增加2%;因此,在40岁时,复发风险为20%,而在70岁时为32%。对于接受TxB的患者,40岁的复发风险为35%,而70岁的复发风险为47%。在40岁和70岁时,复发风险的治疗差异均为15%。当使用统计学模型时,p值为0.025,证实了年龄的预后效应。然而,当进行治疗-年龄交互效应检验时,p值为0.45,表明年龄并不具有预测性。临床医生需要对已发表的文献进行明确的描述和分析,以确定一个因素是预后性还是预测性。这可以通过在表格中提供完整的回归分析来实现,还需要明确描述交互效应检验,以确保解释的准确性。交互效应检验的一个局限性在于power(统计学效能)较低,因此即使某个因子确实具有预测性,也可能无法观察到显著的p值。理想情况下,研究应该有充分的设计和/或power进行亚组分析和/或交互效应检验。支持预后和预测因素的最有力证据是几项大型试验和/或验证性研究结果的复制和一致性,以及支持这些结果的生物学原理。亚组分析(预后性或预测性)通常被认为是假设性的,需要在几项大型研究(或荟萃分析)中重现,且具有适当的潜在生物学合理性。未来,迫切需要进一步评价临床试验中的预后和预测因素,以促进我们对疾病的理解,并进一步调整治疗方案获得最佳的患者结局。Simms L, Barraclough H, Govindan R. Biostatistics primer: what a clinician ought to know--prognostic and predictive factors. J Thorac Oncol. 2013 Jun;8(6):808-13. doi: 10.1097/JTO.0b013e318292bdcd.