推荐!这个流行病大神制作的公共卫生研究小工具,可以计算标准化率及置信区间
公共卫生多截面数据如何统计分析系列(2)
随着国家疾控监测体系的日趋完善,以年份为单位,进行多截面调查与监测的数据越来越多。比如5年健康素养调查数据趋势性分析、10年浙江居民健康体检数据血压值的分析、慢性病发病数据分析、传染病监测数据的研究等。全国各地区疾控中心已经积攒了不计其数的医学大数据,其中大部分都是多时间多截面调查数据。
多截面调查指的是,按照固定间隔时间(一般是一年)对某一地区的人群进行抽样调查或者监测,获得健康有关的数据以及与暴露有关的数据,主要可以用于分析健康结局的时间趋势,并分析相关影响因素。
这一系列,我主要结合一篇JAMA文章来探讨多截面数据的分析任务与统计分析方法。文献来自JAMA杂志关于美国高血压20年的趋势性分析。
这篇论文,我读后认为它是公共卫生多截面调查数据分析的典型性作品。它里面涉及到了诸多经典的统计学方法。
多截面调查有哪一些分析任务呢?
我这里罗列以下该篇文章的分析内容清单
(1)计算不同年份的标准化率及置信区间
(2)标准化率的时间趋势变化
(3)标准化率的时间趋势分析(P值)
(4)影响高血压患病率的影响因素
(5)非线性趋势的分析方法(额外任务)
今天,我们来研究下标准化率及其置信区间。
公共卫生领域标准化率是一个重要的计算指标,主要用于不同时间、不同地区、不同特征的人群比较疾病发生率的方法。。。。。。我就不多说了,学公共卫生的人都知道。
现在,我想对4次调查(2008、2012、2014、2018)的高血压数据进行性别标准化。以合并人口(构成比)作为参照人口,进行标准化率计算。
以下是各年度的男女构成比和高血压发病率
标准化率的算法有直接法和间接法,直接法是根据合并人口的构成比或者各层人口数来计算标准化率,而间接法是根据合并人口的发生率来计算标准化率,一般常见采用直接法来进行。
对于计算标准率,一般excel的工具就可以了。我们选择一个标化人口(按照全国人口,或者合并人口数),然后根据各年龄的患病率,即可计算标化发病人数和标化率!
这里强力推荐流行病大神Rothman(这个星球上最知名的流行病学教材Modern epidemiology 作者)制作的计算标化率的excel工具:只要把人口数和构成比输入进excel,就可以帮助我们计算标准化率及95%CI置信区间了。一般我们手工可以计算标准化率,但是95%CI可不是能够计算的哦。
结果得到2008、2012、2014、2018各年度的高血压标化发生率和95%CI分别是17.6%(16.8-18.6)、27.5%(24.4-30.7)、27.7%(24.4-30.9)、44.5%(43.2-45.8%)。
这里,我这里非常推荐开展公共卫生研究的朋友们,来下载该软件使用。我想你们每年都会接到标化率计算的任务,这个工具,好用的很!下载方式见下文。
其实,大神Rothman的这个excel小工具不仅就可以计算标化率还可以计算流行病学非常多的 一些指标。可用于病例对照研究、队列研究、样本来计算等多个场景。对于从事公共卫生工作的朋友来说,简直是个宝贝!
公共卫生小工具下载方式
所有资料可通过关注公众号,发送关键词“资源下载”至公众号,即可获得免费下载。