生存分析的数据类型(左删失、右删失...),你都了解吗?

2019-03-26 12:55

对于长期纵向观察的随访研究,我们常常会用到生存分析。生存分析的一个很大优点在于,它不仅考虑到终点事件的发生与否,同时也将终点事件出现的时间考虑在内,有效的解决了在研究中时间因素所带来的影响。

与其他分析方法不同,根据生存结局的发生情况,生存分析的数据资料常常分为终点事件(如死亡)和删失(其他生存结局)两类,今天小咖就来带大家一起辨析一下生存分析中不同的数据类型,以帮助大家更好的理解生存分析问题。

一、完全数据(Complete data)

在研究过程中,如果能够明确的观察记录到每个研究对象的生存时间,或发生终点事件的具体时间,我们把这种类型的数据称之为完全数据。其中生存时间(Survival time)是指从规定的观察起点(起始事件)到发生某一特定终点事件之间经历的时间跨度。

但是,在实际的研究随访中,常常会因为各种各样的原因,在很多情况下数据是很难完全观察到的,因此无法保证全部获得完全数据。

二、删失数据(Censoring data)

与完全数据相反,如果在研究结束的时候,研究对象发生了研究之外的其他事件或生存结局,无法明确的观察记录到发生终点事件的生存时间,我们把这种类型的数据称之为删失数据,或不完整数据(Incomplete data)

删失数据通常在其右上角标记“+”号,表示真实的生存时间未知,只知道比观察到的删失时间要长。在生存分析中,发生终点事件记为“1”,删失记为“0”。

产生删失的可能原因

(1) 到达研究截止日期时,终点事件仍然没有发生,研究对象依然存活

(2) 研究对象因为搬迁、更换电话号码等原因失去联系造成失访,无法明确观察到研究对象是否发生了终点事件,以及具体的发生时间

(3) 研究对象不配合、或医生改变治疗方案等其他原因,造成研究对象中途退出研究,无法继续进行随访观察

(4) 研究对象死于其他事件,例如死于交通事故,或者因其他疾病造成死亡

删失的类型

(1) 右删失(Right censored)

在进行随访观察中,研究对象观察的起始时间已知,但终点事件发生的时间未知,无法获取具体的生存时间,只知道生存时间大于观察时间,这种类型的生存时间称为右删失。右删失是实际研究中最常见的数据删失类型,根据观察结束时间的不同,可以进一步分为3种类型

I型删失(Type I censoring)

所有研究对象的观察起点时间是统一的,在研究随访的过程中,除了已经发生终点事件的研究对象外,其余研究对象的观察时间统一截止到某一固定的时间,这种删失类型即为I型删失。I型删失的删失时间是固定的,因此又称为定时删失。I型删失不允许个体在研究的过程中退出。

(注:图中x表示发生终点事件,O表示删失)

例如,某项关于临床药物的研究,所有研究对象在统一时间开始接受药物干预,但由于随访时间和研究经费的限制,在研究计划的固定观察周期内,研究人员无法观察所有研究对象都发生终点事件,到达随访截止时间后不再进行观察,未发生终点事件的研究对象的生存时间未知,但肯定不小于研究时间。

II型删失(Type II censoring)

所有研究对象的观察起点时间是统一的,在研究的过程中,一直随访观察到有足够数量的终点结局事件发生为止,此时研究停止,未发生终点事件的研究对象的生存时间未知,这种删失类型即为II型删失。II型删失可以理解为删失比例是事先已经设定的。

(注:图中x表示发生终点事件,O表示删失)

例如,某项关于临床药物的研究,所有研究对象在统一时间开始接受药物干预,研究计划一共观察到100例终点事件为止,当第100例终点事件发生时,就停止研究不再进行随访观察,其余未发生终点事件的研究对象,其生存时间均以第100例事件发生的时间进行记录,但他们实际的生存时间是未知的,且不小于研究时间。

III型删失(Type III censoring)

在实际的研究过程中,往往不能保证所有研究对象在同一时间同时进入研究,在研究开始后,随着研究对象的陆续招募进入研究,不同研究对象的观察起始时间有先有后。同时,在研究结束前,有些研究对象已经发生终点事件,可以记录其准确的生存时间,但也有些研究对象中途退出研究,或者在研究结束时仍然未发生终点事件,他们的生存时间无法明确。

这种观察起始时间和删失时间均不相同的类型,称之为III型删失,也是临床研究中最为常见的类型。由于删失数据往往是随机发生的,因此III型删失也称为随机删失(Random censoring)。

(注:图中x表示发生终点事件,O表示删失)

(2) 左删失(Left censored)

假设研究对象在某一时刻开始进入研究接受观察,但是在该时间点之前,研究所感兴趣的时间点已经发生,但无法明确具体时间,这种类型即为左删失数据。

例如,某项关于脑卒中复发危险因素的研究,生存时间规定为从第一次脑卒中发病到下一次脑卒中发病之间的时间间隔。在研究起始时刻对研究对象进行问卷调查,询问是否发生过脑卒中,以及第一次脑卒中发病的时间,如果研究对象回答“发生过脑卒中,但不记得发病的具体时间了”,此时无法明确获取第一次脑卒中发病时间,该数据即为左删失。

(3) 区间删失(Interval censored)

在实际的研究中,如果不能够进行连续的观察随访,只能预先设定观察时间点,研究人员仅能知道每个研究对象在两次随访区间内是否发生终点事件,而不知道准确的发生时间,这种删失类型称为区间删失。

例如某个研究对象在第一次随访时间点未观察到终点事件发生,在下一次随访时已经发生了终点事件,但研究人员无法获取发生时间的具体时间,只知道在这两次随访间隔的中间,生存时间并不明确,因此则认为该研究对象的生存时间在两次随访间隔内是区间删失。

(0)

相关推荐