临床预测模型:基本概念、应用场景及研究思路
当医学从经验医学发展到循证医学,从循证医学再到精准医学,数据的价值得到前所未有的重视,大数据时代数据的获取、存储以及分析与预测技术的迅速发展使得个性化医疗的愿景越来越成为可能[1]。临床预测模型作为风险与获益评估的量化工具,可为医生、病人以及医疗政策制定者的决策提供更为直观理性的信息,因此其应用也越来越普遍。本文将从临床预测模型的概念、应用场景以及研究思路三个方面做一总结。
1 临床预测模型的基本概念
临床预测模型(Clinical Prediction Models),又称临床预测规则(Clinical Prediction Rules)、预测模型(PrognosisModels)或者风险评分(Risk Scores),是指利用多因素模型估算患有某病的概率或者将来某结局发生的概率[2-5]。临床预测模型包括诊断模型(Diagnosticmodels)和预后模型(Prognostic Models)(图1)[3]。诊断模型关注的是基于研究对象的临床症状和特征,诊断当前患有某种疾病的概率,多见于横断面研究;预后模型关注的是在当下的疾病状态下,未来某段时间内疾病复发、死亡,伤残以及出现并发症等结局的概率,多见于队列研究。不过诊断模型与预后模型也有很多相似之处:如结局多为二分类,虽然少数情况下也有血压、血脂、血糖、疼痛评分以及生存质量评分等连续指标作为结局;研究的效应指标均为结局出现的绝对风险,即发生的概率,而非相对危险度(RR)、比值比(OR)或者风险比(HR)等相对风险效应指标;在模型的技术层面,也都需面临预测因子的选择、建模的策略、模型性能的评价等环节(图2)。
图 1:临床预测模型的概念
图2:诊断模型与预后模型的异同
2 临床预测模型的应用场景
临床预测模型在医学研究与实践中的应用非常广泛。借助临床预测模型,医生和病人可以更好的做出共同决策,临床研究者可以更精准的筛选合适的研究对象,政府部门与卫生管理者也可以更好的进行医疗质量的管理,合理的配置医疗资源。此外,临床预测模型的作用也体现在疾病的三级预防体系中:(1)疾病的一级预防。临床预测模型可以给病人和医生提供基于当前的健康状态,未来患有某病的量化风险值(概率),为健康教育和行为干预提供更直观、有力的科学工具。例如,基于福明翰心脏研究的福明翰心血管病危险评分就明确了降低血脂、血压可以预防心肌梗死[6]。(2)疾病的二级预防。临床预测模型,尤其是诊断模型,常可借助无创的、低成本、易采集的指标,给出高灵敏度和特异度的诊断方案,践行“早发性,早诊断,早治疗”的疾病预防理念,具有重要的卫生经济学意义。(3)疾病的三级预防。预后模型可对疾病的复发、死亡,伤残以及出现并发症的概率给出量化的估算,从而指导对症治疗和康复方案的制定,防止伤残和促进功能恢复,提高生存质量,延长寿命,降低病死率。
本文多讨论的临床预测模型与“预测研究策略”研究组(PROGRESS)曾提出过“预测研究”(Prognosis Research)的基本框架既有部分交叉重叠,也有部分区别。“预测研究策略”研究组提出的“预测研究“框架包括四个方面[7-10]:(1)基本预后研究,即自然状态以及当前医疗质量下疾病的进程;(2)预后因素研究,即与预后相关的特定因素;(3)预后模型研究,即建立、验证预测个体未来结局风险的统计模型,并评估其影响;(4)分层医学研究,即利用预后信息调整个体或是具有相同特征人群的治疗决策。其中前两点分别对应传统流行病学研究中疾病的基本描述与危险因素研究,第三点对应本文所讨论的预后模型,最后一点的“分层医学”与“精准医学”相对应[11]。
3 临床预测模型的研究思路
临床预测模型并非单纯拟合一个统计模型那样草率简单。从模型的建立到应用,临床预测模型有一套完整的研究流程。多个学者都曾讨论过临床预测模型的研究思路[2, 12-15]。笔者综合文献及个人研究经验,总结其研究步骤如下(图3)。
图3 临床预测模型的研究思路
3.1 明确研究问题,选择研究类型 临床预测模型适合回答疾病的诊断或预后相关问题,且不同的问题需采用不同的研究设计类型。例如,对于诊断类问题,其预测因子与结局均在同一时点或很短的时间内,适合采用横断面研究数据构建诊断模型;对于预后类问题,其预测因子与结局有纵向的时间逻辑,适合采用队列研究数据拟合预后模型。诊断模型研究中,需要有“金标准”来单独诊断疾病,且“金标准”的诊断应该在“盲法”状态下进行,即“金标准”的诊断不能借助预测模型中的预测因子信息,以避免诊断评估偏倚(diagnostic review bias)。预后模型研究中,预测因子与结局的本质就是纵向关系,且研究者通常希望获得在自然状态下疾病的转归,因此前瞻性队列研究是预后模型最常见,也是最佳的研究设计类型。
3.2 设计与实施,数据质控与管理 若为全新研究,则应从研究方案、研究者操作手册、病例报告表、伦理批件等相关文件的准备开始,并进行数据质控与管理;若为基于其它研究数据开展的研究,也应对数据质量进行评估。
3.3 建立临床预测模型 建立模型前,应明了已知的、以报道的预测因子,确定入选预测因子的原则及方法、选用模型的类型(通常为Logistic模型或Cox模型)。拟合模型、估算模型参数后,需要借助区分度(discrimination),校准度(calibration)等指标评估模型的性能。
3.4 验证临床预测模型 预测模型的效果很有可能因场景、人群的改变而变化。因此,完整的预测模型研究应包括模型的验证。验证的内容包括模型的内部效度和外部效度。内部效度体现模型的可重复性(reproducibility),利用研究项目本身的数据通过交叉验证(cross-validation)、Bootstrap 验证等方法来回答;外部效度体现模型的普遍性(generalizability),需利用研究项目本身以外的数据(从时间上、地理上独立或者完全独立的数据)来回答。
3.5 评价临床预测模型的应用与影响 临床预测模型的最终意义在于应用临床预测模型是否改变了医生/病人的行为、改善了病人的结局或者成本效应,此即临床预测模型的影响研究。与临床预测模型的验证不同,影响研究需要设计随机对照试验,且通常为整群随机对照试验来评估。
3.6 临床预测模型的更新 即便是经过良好验证的临床预测模型,由于疾病危险因素、未测量的危险因素、治疗措施以及治疗背景等随时间变化,模型性能因此下降,即校准度漂移(calibration drift)。因此,临床预测模型需要不断进化、动态更新。
临床预测模型的本意是借助少量的、易收集的、检测成本低廉的预测因子来预测疾病的状态和预后。因此,大多数预测模型都是短小精炼型的。这在信息技术不发达、数据收集、存储、分析成本高的时代是科学而理性的。但随着经济的发展、技术的进步,数据的收集、存储成本大大降低,数据分析技术日益提高,临床预测模型也应突破固有的观念,采用更大量丰富的数据(大数据),复杂的模型和算法(机器学习、人工智能),以更精准的结果服务与医生、病人以及医疗决策者。
参考文献:
略
推荐 临床研究统计图表系列: