绝对好方法!公共卫生多截面(2010-2020)调查数据如何分析?

随着国家疾控监测体系的日趋完善,以年份为单位,进行多截面调查与监测的数据越来越多。比如5年健康素养调查数据趋势性分析、10年浙江居民健康体检数据血压值的分析、慢性病发病数据分析、传染病监测数据的研究等。全国各地区疾控中心已经积攒了不计其数的医学大数据,其中大部分都是多时间多截面调查数据。

多截面调查指的是,按照固定间隔时间(一般是一年)对某一地区的人群进行抽样调查或者监测,获得健康有关的数据以及与暴露有关的数据,主要可以用于分析健康结局的时间趋势,并分析相关影响因素。

它有如下特点:

(1)它是个体化的数据,而非生态学汇总数据。

(2)它虽然跨时间调查,但不是随访数据,不是队列研究而是横截面调查。

(3)它不属于一般意义的重复测量资料。

(4)不同年份研究对象特征基本都不一致,若需要分析时间趋势,则需要先进行校正而后开展分析。

比如,在杭州某区开展一年一次慢性病高血压调查,2015-2020年,每年分别抽样调查1000名,请分析杭州地区慢性病患者血压控制率的总体水平及时间变化趋势,并探讨影响血压控制的因素。

我模拟建立了一个1000*5的样本库。

sex性别

age年龄

year          年份

migration 是否本地居民

huji                 城镇或农村

education         教育程度

marriage 婚姻状况

drinking 饮酒

smoking    吸烟

result                是否合格

那么多截面数据如何分析呢?我想和大家谈一谈。这次的谈法,其实是一场文献学习。文献来自JAMA杂志关于美国高血压20年的趋势性分析。

这篇论文,我读后认为它是公共卫生多截面调查数据分析的典型性作品。它里面涉及到了诸多经典的统计学方法。

-本文结束-

(0)

相关推荐