绝对好方法!公共卫生多截面(2010-2020)调查数据如何分析?
随着国家疾控监测体系的日趋完善,以年份为单位,进行多截面调查与监测的数据越来越多。比如5年健康素养调查数据趋势性分析、10年浙江居民健康体检数据血压值的分析、慢性病发病数据分析、传染病监测数据的研究等。全国各地区疾控中心已经积攒了不计其数的医学大数据,其中大部分都是多时间多截面调查数据。
多截面调查指的是,按照固定间隔时间(一般是一年)对某一地区的人群进行抽样调查或者监测,获得健康有关的数据以及与暴露有关的数据,主要可以用于分析健康结局的时间趋势,并分析相关影响因素。
它有如下特点:
(1)它是个体化的数据,而非生态学汇总数据。
(2)它虽然跨时间调查,但不是随访数据,不是队列研究而是横截面调查。
(3)它不属于一般意义的重复测量资料。
(4)不同年份研究对象特征基本都不一致,若需要分析时间趋势,则需要先进行校正而后开展分析。
比如,在杭州某区开展一年一次慢性病高血压调查,2015-2020年,每年分别抽样调查1000名,请分析杭州地区慢性病患者血压控制率的总体水平及时间变化趋势,并探讨影响血压控制的因素。
我模拟建立了一个1000*5的样本库。
sex性别
age年龄
year 年份
migration 是否本地居民
huji 城镇或农村
education 教育程度
marriage 婚姻状况
drinking 饮酒
smoking 吸烟
result 是否合格
那么多截面数据如何分析呢?我想和大家谈一谈。这次的谈法,其实是一场文献学习。文献来自JAMA杂志关于美国高血压20年的趋势性分析。
这篇论文,我读后认为它是公共卫生多截面调查数据分析的典型性作品。它里面涉及到了诸多经典的统计学方法。
-本文结束-
赞 (0)