SEER数据库系列|SEER数据库基本介绍

欢迎来到医科研,这里是白介素2的读书笔记,跟我一起聊临床与科研的故事, 生物医学数据挖掘,R语言,TCGA、GEO数据挖掘。

背景摘要

美国国家癌症研究所(National Cancer Institute)的SEER数据库收集了大约30%的美国人口的癌症诊断,治疗和生存数据。为了反映研究和肿瘤学实践的进步,癌症控制的方法正在不断发展,从简单地按人群中器官部位枚举癌症的发展到包括通过组织病理学和分子亚型(由驱动程序突变和其他改变)来监测癌症的发生。SEER是一个重要的基于人群的资源,可用于研究跨人口统计学特征,地理区域和时间的病理诊断含义,已成为美国肿瘤学实践的独特研究资源(注意是美国的数据)。它提供了不同组织病理学癌症亚型的发病率,生存率和死亡率数据,并且分子分型的数据也在扩展。该数据库正在进一步开发,以捕获其他生物标志物数据,特殊人群的结果,并扩大生物样本库,以支持能够改善肿瘤学实践的前沿癌症研究。

由于分子生物学的进步,包含组织病理学数据与分子表达谱数据都用以定义肿瘤分型,其中著名的TCGA数据库是一个代表性的数据库,成为临床肿瘤研究与流行中的重要组成部分。将分子数据与传统组织病理数据整合起来用于重新定义肿瘤分型正在重新定义肿瘤实践。

SEER计划

SEER计划由总统理查德·尼克松(Richard Nixon)于1973年1月1日发起,是《国家癌症法》的一部分。SEER收集有关在代表性地理区域和亚人群中诊断出的所有癌症的人口统计,临床和结果信息。纳入的区域是根据其操作和维护高质量的基于人群的癌症报告系统或癌症注册系统的能力来选择的。最初,包括具有流行病学意义上重要的种族和少数族裔亚组的7个SEER注册中心,现在已逐步扩展到当前的18个(SEER)癌症注册中心。

image.png

SEER数据简介

  • SEER目前每年捕获400,000个癌症病例,并存储大约30%的美国人口的癌症数据。病理报告是提取SEER数据的重要来源,在大约80%的病例中,病理报告是从大约360个实验室以电子方式实时获得的。

  • 将提取的病理数据与其他来源的数据合并到最终病例记录中。这些来源包括患者病历,从独立的诊断影像和化疗诊所收集的报告以及死亡证明。传统癌症注册工作人员提取标准数据项,然后将相应的文本手动输入到数据收集模板中,近80%的实验室使用电子病理报告功能有潜力启用自然语言处理(NLP)软件来自动编码数据字段。然后这些摘要记录由注册工作人员进行审查,将检查、编辑所有数据并将其合并到年度登记数据库中,并以身份不明的形式将其提交给美国国家癌症研究所(NCI)。SEER提交的数据将在每年的11进行质量控制和完整性检查,这些数据将在来年的4月份开放使用

  • 值得注意的是,SEER不会收集有关整个美国人口的数据。但是,它确实与北美中央癌症登记处协会(NAACCR)和NPCR进行了协调,以收集美国总人口的癌症数据。联邦癌症统计数据的年度报告发布为“美国癌症统计数据:发病率和死亡率报告”,涵盖了来自45个州的96%的美国人口。

[参考文献]https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5106320/

(0)

相关推荐

  • 除了利用SEER、TARGET数据,你还可以利用这个数据库做预测模型

    除了利用SEER.TARGET数据,你还可以利用这个数据库做预测模型,这个数据库就是TCGA呀,TCGA也包含大量的临床信息,可以通过下载它的临床数据来进行预测模型,TCGA临床数据的下载方法有很多种 ...

  • 强烈推荐!大型医学公共数据库大盘点

    本文作者杨其霖,第七期小黑屋学员,学号:BH70256,广医二院重症医学科医生,众多小黑屋训练营学友的新晋男神~ 输12 为什么要挖掘公共数据库??? 每次想到这句话就有为何不吃肉糜的感觉. 数据矿主 ...

  • SEER专题 | SEER数据库使用手册

    本文作者为学号BH70429麻醉专业的李燕医生. SEER公开数据库是是美国权威的癌症统计数据库,2020年4月发布的最新的数据库记录了1975-2017年美国部分州县上百万名恶性肿瘤患者的发病率.死 ...

  • 美国健康信息趋势调查数据集(HINTS)介绍

    对于公共数据集而言,除了目前用的比较多的TCGA数据库.在很多流行病学调查领域也存在很多公共的数据.在肿瘤方面,经典的就是SEER这个数据库.这个数据库提供了美国多个地区的关于肿瘤的人口学的调查信息. ...

  • SEER数据简单玩法文献分享

    论文题目 Marital Status and Survival of Patients with Chondrosarcoma: A Population Based Analysis 论文摘要 背 ...

  • 大数据时代最全的医学公共数据库合集整理

    数据库技术是研究.管理和应用数据库的一门软件科学.通过研究数据库的结构.存储.设计.管理和应用的基本理论和实现方法,对数据库中的数据进行处理和分析. 本文我们将介绍几种数据库和数据挖掘技术,帮助临床研 ...

  • SEER数据库临床预测模型Nomogram列线图绘制R语言自学

    什么是SEER: Surveillance(监控), Epidemiology(流行病学), End Results(最终结果)即SEER.SEER激活划提供有关癌症统计信息,以减少美国人群的癌症负担 ...

  • SEER数据库系列|SEER数据挖掘文章有哪些研究模式

    欢迎来到医科研,这里是白介素2的读书笔记,跟我一起聊临床与科研的故事, 生物医学数据挖掘,R语言,TCGA.GEO,SEER数据挖掘. . SEER数据的大规模数据优势是无可比拟的.大规模的病例数还可 ...

  • SEER数据库系列|SEER数据分析

    欢迎来到医科研,这里是白介素2的读书笔记,跟我一起聊临床与科研的故事, 生物医学数据挖掘,R语言,TCGA.GEO,SEER数据挖掘. . SEER数据分析 SEER计划由18个地区癌症登记机构组成的 ...

  • SEER数据库系列|SEER数据库数据内容的完善

    欢迎来到医科研,这里是白介素2的读书笔记,跟我一起聊临床与科研的故事, 生物医学数据挖掘,R语言,TCGA.GEO,SEER数据挖掘. SEER数据的内容完善 SEER数据 为所有原发侵袭性癌和其他某 ...

  • SEER文献精读|SEER数据库3分文章

    欢迎来到医科研,这里是白介素2的读书笔记,跟我一起聊临床与科研的故事, 生物医学数据挖掘,R语言,TCGA.GEO, SEER数据挖掘. 本文由上海乳腺癌重点实验室:复旦大学上海癌症中心,癌症医学合作 ...

  • TCGA与SEER两大癌症数据库首次比较

    做生物信息分析会经常看到两个数据库,一个时TCGA数据库,一个是SEER数据库,特别是癌症分析,这两大数据库是绕不开的.随着国内对TCGA数据研究不断深入,越来越多的人选择TCGA数据库作为癌症分析的 ...

  • 【数据库】SRA数据库介绍及数据下载

    [数据库]SRA数据库介绍及数据下载 - 目录 1. SRA数据库介绍 (1) SRP开头的ID:PRJNA = SRP (2) PRJNA开头的ID:SAMN = SRS (3) SRX开头的ID ...

  • 数据库:分布式数据库•新变量

    数据库行业:行业螺旋上升,分布式数据库时代到来 数据库发展需要关注增量市场,分布式数据库或成新机遇 数据库的发展与计算载体紧密相关.数据库是计算机行业的基础核心软件,所有应用软件的运行和数据处理都要与 ...

  • UG编程第十二讲-刀具加工数据库,加工数据库的讲解

    从零基础学习软件,会建模画图,2D转3D,优化模型结构,出图技巧,到软件基础加工,刀具设置,工序参数设置,加工模板定制以及后处理的安装与制作,加上工厂的各类产品零件的实际加工技巧,经验,加上工厂的各类 ...

  • 商业分析师系列课程-01课程介绍

    商业分析师系列课程-01课程介绍