SEER数据库系列|SEER数据库数据内容的完善

欢迎来到医科研,这里是白介素2的读书笔记,跟我一起聊临床与科研的故事, 生物医学数据挖掘,R语言,TCGA、GEO,SEER数据挖掘。

SEER数据的内容完善

SEER数据 为所有原发侵袭性癌和其他某些诊断(例如原位癌)收集的数据包括诊断日期和人口统计变量,例如诊断时的年龄,性别,种族/民族和居住的县。从健康记录中提取与第一疗程有关的手术管理和/或放射治疗数据

  • 1983年增加了详细的手术切除方案

  • 并于1998年完成了所有肿瘤类型的手术切除方案。该程序会记录放射治疗的类型以及分娩是新辅助,辅助还是术中的,还可以根据具体要求评估化学疗法的使用数据(是,否或未知)。

  • SEER还根据2000年《国际肿瘤分类学》第3版或ICD-O-3.收集解剖部位,配对器官的偏侧性,大小和组织病理学类型的肿瘤数据。

  • 2004年添加了一些癌症的肿瘤标志物,例如睾丸癌,乳腺癌和前列腺癌。

  • 截至2010年,根据美国癌症联合委员会AJCC第7版增加了肿瘤等级,扩展/转移,部位特异性因素和分期数据。

癌症数据每年更新一次,以获取生存状态,生存时间和死亡原因等信息。SEER最初的7个癌症登记中心的随访时间现已超过40年。生存状态通过与 National Death Index 链接以及通过医疗记录摘要获得的最近一次已知联系的日期的补充数据来确认。SEER被认为是美国和全球癌症注册机构中数据质量的黄金标准。通过与地区注册机构的合同协议来保证质量,并且在传输数据之前必须满足SEER的标准

SEER数据的开放

SEER允许不受限制地访问SEER网站www.seer.cancer.gov,SEER数据的复制和获取无需经过许可。癌症统计资料审查(Cancer Statistic Review)”选项以易于理解的文字,图表和图形提供所有癌症和特定部位癌症的摘要信息。除了癌症数据集外,SEER中的其他数据集还有SEER地区的标准人口数据,美国死亡率数据以及与人口普查区域社会经济状况索引或县属性相关联的美国人口数据。这些数据可用于与SEER癌症数据进行匹配分析。除此以外 SEER数据还与其它数据库链接以支持更深层次的研究挖掘。包括:Medicare, Medicare Health Outcomes Survey (SEER-MHOS)National Longitudinal Mortality Study (NLMS), 以及链接的生物样本。


划重点:SEER提供专门用于提取分析数据的软件:包括SEER * StatSEER PREPJointPointHealth Disparities Calculator。只需要填写申请表格申请下即可免费使用所有数据库和软件,附上表格的链接(www.seer.cancer.gov/data/access_seer_data.pdf)。

SEER生物样本试点计划

SEER非常重视病理材料的可用性,以进行免疫组织化学(IHC)检测和二代代测序等分析。RTR和最新提出的VTR是近期的试点计划,旨在扩大各种癌症病例的病理学材料的“生物储备”,并将组织链接(注释)到完整的SEER数据集9。RTR维护来自3个癌症登记机构(爱荷华州,夏威夷和洛杉矶)的组织,并且由福尔马林固定石蜡包埋的组织块在所有特定部位的癌症上组成。到2010年已检测的癌组织数量达到141,241最大的四个癌症组是肺癌,结肠癌/直肠癌,乳腺癌和前列腺癌。研究人员可以通过提交在线申请(www.seer.cancer.gov/biospecimen/application.html)并提供拟进行的研究的简要摘要,来访问基于人群的资料,也可以使用某些癌症的组织微阵列数据,例如乳腺癌,卵巢癌和结肠/直肠癌。

VTR是一个试点项目,涉及7个SEER注册管理机构。最初的试点旨在提供有关成本和最佳实践的信息,以将该过程扩展到更大的SEER注册中心。它将专门探讨存活至少5年的胰腺导管腺癌患者和在短时间内死于癌症的局部淋巴结阴性女性乳腺癌患者。病例将与具有更典型生存模式的对照相匹配,并将基于逻辑回归模型中确定的肿瘤和人口统计学特征。最初的试点项目将定义基于人群的生物样本采集的最佳实践。将收集定制的注释信息,包括合并症,详细的化疗,复发时间和结果。实验室调查将收集有关组织位置,检索成本以及将不明身份的数据提供给研究人员的要求的信息。试点项目还将探索获取材料的最佳实践,以及与数字图像和病理学检查的联系。目标是扩大未来的VTR,以支持当前广泛的癌症研究问题。

(0)

相关推荐

  • 越来越多的年轻人得癌症,是什么原因导致的?

    Trends in Cancer Incidence in US Adolescents and Young Adults, 1973-2015 作者:Alyssa R. Scott, Kelsey ...

  • SEER专题 | SEER数据库使用手册

    本文作者为学号BH70429麻醉专业的李燕医生. SEER公开数据库是是美国权威的癌症统计数据库,2020年4月发布的最新的数据库记录了1975-2017年美国部分州县上百万名恶性肿瘤患者的发病率.死 ...

  • 又一国产高分数据库,堪称lncRNA神器

    解螺旋公众号·陪伴你科研的第2470天 想找lncRNA的差异表达和预后?看过来! 之前我们介绍了好用的CRN数据库,可以在线分析差异表达lncRNA并绘制与差异mRNA联系的网络图.那么有没有能直接 ...

  • 美国健康信息趋势调查数据集(HINTS)介绍

    对于公共数据集而言,除了目前用的比较多的TCGA数据库.在很多流行病学调查领域也存在很多公共的数据.在肿瘤方面,经典的就是SEER这个数据库.这个数据库提供了美国多个地区的关于肿瘤的人口学的调查信息. ...

  • 大数据时代最全的医学公共数据库合集整理

    数据库技术是研究.管理和应用数据库的一门软件科学.通过研究数据库的结构.存储.设计.管理和应用的基本理论和实现方法,对数据库中的数据进行处理和分析. 本文我们将介绍几种数据库和数据挖掘技术,帮助临床研 ...

  • SEER数据库临床预测模型Nomogram列线图绘制R语言自学

    什么是SEER: Surveillance(监控), Epidemiology(流行病学), End Results(最终结果)即SEER.SEER激活划提供有关癌症统计信息,以减少美国人群的癌症负担 ...

  • SEER数据库系列|SEER数据挖掘文章有哪些研究模式

    欢迎来到医科研,这里是白介素2的读书笔记,跟我一起聊临床与科研的故事, 生物医学数据挖掘,R语言,TCGA.GEO,SEER数据挖掘. . SEER数据的大规模数据优势是无可比拟的.大规模的病例数还可 ...

  • SEER数据库系列|SEER数据分析

    欢迎来到医科研,这里是白介素2的读书笔记,跟我一起聊临床与科研的故事, 生物医学数据挖掘,R语言,TCGA.GEO,SEER数据挖掘. . SEER数据分析 SEER计划由18个地区癌症登记机构组成的 ...

  • SEER数据库系列|SEER数据库基本介绍

    欢迎来到医科研,这里是白介素2的读书笔记,跟我一起聊临床与科研的故事, 生物医学数据挖掘,R语言,TCGA.GEO数据挖掘. 背景摘要 美国国家癌症研究所(National Cancer Instit ...

  • SEER文献精读|SEER数据库3分文章

    欢迎来到医科研,这里是白介素2的读书笔记,跟我一起聊临床与科研的故事, 生物医学数据挖掘,R语言,TCGA.GEO, SEER数据挖掘. 本文由上海乳腺癌重点实验室:复旦大学上海癌症中心,癌症医学合作 ...

  • TCGA与SEER两大癌症数据库首次比较

    做生物信息分析会经常看到两个数据库,一个时TCGA数据库,一个是SEER数据库,特别是癌症分析,这两大数据库是绕不开的.随着国内对TCGA数据研究不断深入,越来越多的人选择TCGA数据库作为癌症分析的 ...

  • 菜鸟记123-ACCESS数据库简单应用1-两数据表简单查询应用

    关键词:ACCESS2016:查询:操作难度**** 新的学期教学任务书要开始编撰了,教务处王处长要求小菜在任务书的基础上将教师的信息添加,便于更好分析.小菜手里有任务书和教师信息两个工作表,怎么能快 ...

  • 菜鸟记124-ACCESS数据库简单应用2-多数据表简单查询应用

    关键词:ACCESS2016:查询:多数据表:操作难度**** 昨天小菜和您分享的是从两个数据表中建立关联查询我们所需数据,如果您没看过瘾,今天再和您分享一个小栗子 今年的职称评审工作又开始了,人事处 ...

  • 【竺】数据库笔记5——常见数据库面试题

    【竺】数据库笔记5——常见数据库面试题

  • MySQL数据库插入100w条数据要花多久?

    后端实验室 241篇原创内容 公众号 1.多线程插入(单表) 2.多线程插入(多表) 3.预处理SQL 4.多值插入SQL 5.事务(N条提交一次) 多线程插入(单表) 问:为何对同一个表的插入多线程 ...