Nhanes数据库介绍及使用(一)

1. NHanes数据库介绍NHanes是比较有名的公共数据库,虽然已经有前人发过不少文章。但主要肯挖掘,还是有好文章产出。(以一篇BMJ文章为例:Weight change across adulthood in relation to all cause andcause specific mortality: prospective cohort study,真正诠释了啥叫不起眼的数据发大文章,所以说重要的还是idea)美国国家健康与营养调查( NHANES, National Health and Nutrition Examination Survey)是一项基于人群的横断面调查,旨在收集有关美国家庭人口健康和营养的信息。项目每年调查一个全国代表性的样本,约5000人,这些人群位于全国各县。NHANES访谈部分包括人口统计学、社会经济学、饮食和健康相关问题。体检部分包括生理测量、实验室检查等内容。当然介绍的再多都不如自己去网站逛一逛https://www.cdc.gov/nchs/nhanes/index.htm2. NHanes数据库使用教程(以SAS为例)下载数据:(1) 网页直接下载:

以2005-2006的人口学数据为例,点击画红框的区域即可下载,数据为xpt格式(2) 代码下载:filename xptIn url "https://wwwn.cdc.gov/nchs/nhanes/2015-2016/DEMO_I.xpt"; libname xptIn xport;导入数据:(1) 网页下载数据集导入:libname XP xport "C:\NHANES\DATA\DEMO_I.xpt"; /*改成相应的硬盘地址*/data demo_i; set xp.demo_i;run; /*复制到work数据集,也就是临时数据集*/data mydata.demo_i; set xpt.demo_i;run; /*复制到mydata数据集,也就是永久数据集*/(2) 下载数据集导入:(只需要复制的步骤)data demo_i; set xp.demo_i;run; /*复制到work数据集,也就是临时数据集*/data mydata.demo_i; set xpt.demo_i;run; /*复制到mydata数据集,也就是永久数据集*/XPT文件格式批量导入(提高效率必备):.xpt扩展也被称为通常由SAS应用创建的数据格式,或许这就是为什么双击xpt文件也能打开的原因(当然双击的效率相较于代码还是略低)批量导入的话肯定要用到宏程序(需要修改的地方只有三处,均已中文注释):/* The code below creates a transport file in the temp folder for use by the macro */ libname testlib xport 'D:\NHANES\trans.xpt'; /*修改为存放xpt数据集的硬盘位置*/ proc copy in=sashelp out=testlib; select retail; run;/* Note: Macro starts here *//* Macro using PROC COPY and the XPORT engine for reading transport files*/%macro drive(dir,ext,out); %let filrf=mydir; /* Assigns the fileref of mydir to the directory and opens the directory */ %let rc=%sysfunc(filename(filrf,&dir)); %let did=%sysfunc(dopen(&filrf)); /* Returns the number of members in the directory */ %let memcnt=%sysfunc(dnum(&did)); /* Loops through entire directory */ %do i = 1 %to &memcnt; /* Returns the extension from each file */ %let name=%qscan(%qsysfunc(dread(&did,&i)),-1,.); /* Checks to see if file contains an extension */ %if %qupcase(%qsysfunc(dread(&did,&i))) ne %qupcase(&ext) %then %do; /* Checks to see if the extension matches the parameter value */ /* If condition is true, submit PROC COPY statement */ %if (%superq(ext) ne and %qupcase(&name) = %qupcase(&ext)) or (%superq(ext) = and %superq(name) ne) %then %do; libname old xport "&dir.\%qsysfunc(dread(&did,&i))"; libname new "&out"; proc copy in=old out=new; run; %end; %end; %end; /* Close the directory */ %let rc=%sysfunc(dclose(&did)); /* END MACRO */ %mend drive; /* Macro call *//*First parameter is the source folder, the second parameter is extension being *//*searched for, and the third parameter is the target directory for the *//*converted files. */ %drive(D:\NHANES,xpt,D:\NHANES\) /*前后修改为存放xpt数据集的硬盘位置,后一个多一斜杠*/3. 下一期内容预告介绍数据集以及研究设计基础知识及权重的使用4. 参考内容郭晓娟, 田国祥, 等. NHANES项目介绍及数据提取流程.[J]. 中国循证心血管医学杂志, 2019, 6(11):654-657.https://wwwn.cdc.gov/nchs/data/tutorials/file_download_import_SAS.sashttps://support.sas.com/kb/33/918.htmlhttps://www.cdc.gov/nchs/nhanes/index.htmhttps://www.reviversoft.com/zh-cn/file-extensions/xpt免费的赞不要忘记点一波,在此谢过~

(0)

相关推荐

  • 手把手教你在NHANES库里下临床数据

    美国国家健康与营养调查(NHANES,National Health and Nutrition Examination Survey)是 一项旨在评估美国成人和儿童健康和营养状况的研究计划,该调查的 ...

  • 【讲座回顾】 第五讲:NHANES项目介绍及数据提取流程

    PUMC流统协会系列讲座之"医学公共数据库的获取与应用"(五) 如何获取医学公共数据库系列  -- NHANES数据库 本周六(2020年12月12日)崔翔同学分享了NHANS数据 ...

  • NHANES专题|NHANES数据库使用手册

    本文作者赵天杨医生,目前就读于 哈尔滨医科大学麻醉学 NHANES全称National Health and Nutrition Examination Survey,即美国国家健康与营养调查,是国家 ...

  • Linux命令行,菜鸟报错之隐藏在换行中的字符^M

    ---by mk 2021-3-13 24:00 本人跟着Jimmy老师学习生信已经1+年,滚爬摩打,已经入行R及Linux.近日,需要在某公共数据库 网站下载资料,打开网页是这样的: 其中需要下载的 ...

  • 强烈推荐!大型医学公共数据库大盘点

    本文作者杨其霖,第七期小黑屋学员,学号:BH70256,广医二院重症医学科医生,众多小黑屋训练营学友的新晋男神~ 输12 为什么要挖掘公共数据库??? 每次想到这句话就有为何不吃肉糜的感觉. 数据矿主 ...

  • 一位零基础主治医生,一年内发表 10 篇 SCI!他的秘密是......

    有多少人,人生前进的道路被一篇 SCI 堵得死死的? 没有 SCI 研究生 / 博士毕不了业,每日都被延毕的阴影笼罩着: 没有 SCI 无法成功晋升,每日在临床起早贪黑干却看不到曙光: 没有 SCI ...

  • 想发文章没数据?NHANES数据库了解一下

    临床太忙没时间录病历资料? 用病历资料研究本科室疾没新意? 做随访研究没时间,太麻烦? 有idea,没数据? 这些问题是不是似曾相识,临床医生想发文章太难了.不要慌,数据量大.覆盖面广.不断更新的NH ...

  • SEO建站入门篇域名、空间、服务器、程序、数据库介绍

    锦绣大地SEO培训基地,拥有大量黑白帽SEO项目实战管理经验,擅长整站优化权重提升.在SEO内页排名技术.单页面优化.渗透劫持.发包技术.快排技术.整站优化技术.长尾词策略等上有打破常规的秘籍. 知识 ...

  • [数据库介绍]一站式表达谱数据分析

    表达谱数据分析的时候,经常包括各种各样的分析.比如差异表达分析,富集分析,GSEA,蛋白相互作用分析等等等等.NetwordAnalyst(https://www.networkanalyst.ca/ ...

  • 第75天: Python 操作 Redis 数据库介绍

    Redis 作为常用的 NoSql 数据库,主要用于缓存数据,提高数据读取效率,那在 Python 中应该如果连接和操作 Redis 呢?今天就为大概简单介绍下,在 Python 中操作 Redis ...

  • 第78天: Python 操作 MongoDB 数据库介绍

    MongoDB 是一款面向文档型的 NoSQL 数据库,是一个基于分布式文件存储的开源的非关系型数据库系统,其内容是以 K/V 形式存储,结构不固定,它的字段值可以包含其他文档.数组和文档数组等.其采 ...

  • 疫苗设计数据库介绍

    随着疫情的发展,目前对于新冠疫苗相信很多人都有一定了认识.当然在新冠之前也就存在其他疾病的疫苗了.疫苗的接种可以有效的防止我们受到其他物种感染的影响.之前常见的还有天花疫苗,HPV疫苗这类.因此对于很 ...

  • EDQM数据库介绍

    EDQM数据库介绍

  • DEAP数据库介绍--来自于音乐视频材料诱发得到的脑电数据

    更多技术干货第一时间送达 DEAP数据库简介 DEAP[1](Database for Emotion Analysis usingPhysiological Signals),该数据库是由来自英国伦 ...