SEER实际操作教程指南01

欢迎来到医科研,这里是白介素2的读书笔记,跟我一起聊临床与科研的故事, 生物医学数据挖掘,R语言,TCGA、GEO, SEER数据挖掘。



  • 基本介绍:SEER数据库全名(Surveillance, Epidemiology, and End Results ),是美国权威的癌症统计数据库,该数据库记录了美国部分州县上百万名恶性肿瘤患者的发病率、死亡率和患病情况等信息。SEER数据库旨在降低美国人口的癌症负担,数据库中肿瘤信息通过SEER*Stat软件进行统一和规范,并定期更新发布。全球肿瘤研究者均通过申请获取部分数据,这为缺少临床科研数据的临床研究者提供了很好的数据来源。此外,SEER数据库样本量大,统计学效能强,这使基于SEER数据库的研究具有较高的临床参考价值。

  • 数据内容:人口统计数据,患者ID, 个人信息,原发灶位置,肿瘤大小,肿瘤编码,治疗方案,死亡原因等信息。包括多种肿瘤,按消化系统划分。

SEER数据下载

  • 下载数据要求注册,提交SEER Research Data Agreement 方可获得下载数据的账号密码。

  • 下载方式有两种

  1. 提供的软件下载SEER*Stat's Client-Server Mode

  2. 下载压缩文件

  • 下载链接

  1. 常规数据(不含治疗信息): 因为发现很难找到,记录下载地址常规数据下载链接

  2. 特殊数据下载,需要在常规数据下载权限基础上,再次提交一个Data Use Agreement for SEER Radiation Therapy and Chemotherapy Information  通过email或传真的方式发送给管理方,方可获得下载权限,也很难找,记录下下载链接地址,治疗信息数据下载链接

  • 注意事项

  • 常规数据下载权限,需要申请,填写 Data Use Agreement 扫描后用email传送给管理方。对方会回复email或传真,给申请用户配发一个 *Numberd SEERStat's **账号,密码。

  • 获取放化疗数据下载权限,在常规数据下载权限的基础上,再次填写 DUA(数据使用协议)扫描后发送给 seerstat@imsweb.com, 对方核对后会给用户设置一个基于申请名的账号, 即 Named SEER*Stat's account。但是要注意的是,这时是没有密码的,需要用户自行去初始化,设置密码,首先需要下载 SEERStat软件, 友情提醒,网速感人,建议使用外网。然后打开软件,填入邮件收到的基于名字的账号, 点击 Password注意注意:点击了一次就可以了,不要轻易关闭弹出的窗口,稍等5-10分钟即可收到邮件,如关闭则需再次点击,收到第二封邮件才有效

SEER数据格式

  • 下载的 SEER数据格式为代码转换形式,相当于密码本,需要对照代码含义 Seerdic文件,提取出有效信息。

SEER数据提取

  • 使用 SEER*stat 软件通过点击的方式,选择感兴趣的数据,导出为文本格式。

  • 使用 Excel清洗数据,进一步整理成矩阵格式,方便后续分析。


本期内容就到这里,我是白介素2,下期再见,点击下方框框留言。

(0)

相关推荐