GEO数据库介绍 (一)

昨天通过岛上生活来和大家了解了一下基本的生信分析文章的思路是什么样子的从荒岛求生看公共数据库生信分析文章。今天就和大家来学习一下GEO数据库,这个存放公共高通量测序数据的地方。

简介

GEO数据库(https://www.ncbi.nlm.nih.gov/gds/)是一个储存芯片、二代测序以及其他高通量测序数据的一个数据库。利用这个数据库,我们可以检索到其他一些人上传的一些实验测序数据。

不涉及任何检测原理的角度来说的话,所谓的高通量检测,其实就是一次性检测很多指标变化的技术。例如我们说的表达谱数据,就是来检测基因表达水平。比如我们要对一个人来进行高通量检测的话,就能知道这个人上万个基因的表达水平了。

基本使用

由于GEO数据库和我们之前介绍的gene数据库 [数据库推荐]gene:基因相关信息查询 以及我们常用来搜索文献的pubmed都是一个机构的。使用这个数据库,我们需要做的就是就是就是提供检索式。检索式可以是简单的几个关键词,也可以是制定特殊的检索式。

例如我们直接搜索gastric cancer

检索结果介绍

我们检索完之后的主要界面是这个样子的。

我们一般可以用到的进一步筛选的过程就是:

  1. 在样本类型当中寻找自己想要的物种。

  1. 由于GEO包括了很多不同组学的数据,如果我们有特定的检索目的的话,我们可以在 Study Type当中来选择合适的数据类型。

  1. 默认的检索结果的排序是基于检索相关性来排序的。而我们再找目标数据的时候。有时候需要看样本量,一般来说样本量越大其实也就越好的。所以我们可以改变一下检索结果的排序。

具体数据集介绍

每一个数据集,我们可以在检索界面上下面的信息当中看到。

如果想要查看数据集的详细信息,我们就可以点击数据集的相关链接,就可以到了了。关于数据集内的详细信息。由于篇幅的限制,我们明天再做介绍。接下来是我们岛上的生存日记。

 GEO岛上日记1.0 

上岛的第一天,首先,我们可以观察一下我们这个岛,这个岛的中间由河流分成了,三个部分。由于上岛的第一天什么都没有,自身业务能力还是太差。所以也没办法进入到别的地方去。只能在很小的范围内活动了。

岛上生活的第一天,就是熟悉熟悉周围的环境,一穷二白来到岛上的我,除了一双勤劳的双手。第一次到一个地方,还是有有一个坐的地方,所以我就想自己动手做一个凳子(胃癌)。同样是制造凳子,基于材料的不同我们就可以制造不同样式的凳子。经过我在岛上的疯跑,我发现岛上有很多材料可以做凳子,比如说,我就发现了石头和木材。

利用石头我就可以造一个石头凳子,利用木材就可以造一个木头凳子。

由于我感觉石头凳子太硬了。坐的屁股疼,最后我决定做了一个木头椅子。

(0)

相关推荐

  • 向GEO数据库提交数据-你想知道的都在这

    欢迎来到医科研,这里是白介素2的读书笔记,跟我一起聊临床与科研的故事, 生物医学数据挖掘,R语言,TCGA.GEO.SEER数据挖掘. . 1. GEO数据库是什么? GEO数据库是免费的公共数据库, ...

  • GEO和ArrayExpress数据库资源惊人

    写在大年初一 昨晚大年三十跟几个实习生还有学徒一起看春晚,间隙刷了下手机,太多祝福语,春晚结束后临睡前的12:30我还是拿起手机一一回复了,虽然可能是群发的,但毕竟是心意. 今早起来去楼下电影院看了个 ...

  • GEO(Gene Expression Omnibus):高通量基因表达数据库

    #GEO是什么? GEO全称Gene Expression Omnibus data base,由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库(通过NCBI首页,All Database ...

  • 【生信笔记】查找GEO数据集

    A 什么是GEO数据库? GEO数据库全称Gene Expression Omnibus database,是由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库.它创建于2000年,收录了世 ...

  • 除了套路分析你还可以这样发生信文章!

    All of gene expression (AOE): An integrated index for public gene expression databases全基因表达(AOE):公共基 ...

  • 除了GEO,其实我们还可以挖掘这个数据库

    很多人知道都GEO这个数据库,但是很多人忽略了这个数据库,这个数据库是什么呢?那就是--ArrayExpress ArrayExpress是什么? ArrayExpress是主要科学期刊推荐的存储库之 ...

  • 如何进行GEO临床数据查询

    推荐两个可以进行GEO临床数据下载的网址 乔治敦癌症数据库(G-DOC)(https://gdoc.georgetown.edu/gdoc/),G-DOC是一个精准医学平台,其中包含来自一万多个患者和 ...

  • SEO建站入门篇域名、空间、服务器、程序、数据库介绍

    锦绣大地SEO培训基地,拥有大量黑白帽SEO项目实战管理经验,擅长整站优化权重提升.在SEO内页排名技术.单页面优化.渗透劫持.发包技术.快排技术.整站优化技术.长尾词策略等上有打破常规的秘籍. 知识 ...

  • [数据库介绍]一站式表达谱数据分析

    表达谱数据分析的时候,经常包括各种各样的分析.比如差异表达分析,富集分析,GSEA,蛋白相互作用分析等等等等.NetwordAnalyst(https://www.networkanalyst.ca/ ...

  • 重磅!中文版GEO数据库来了!

    没有样本,没钱测序,如何拿别人的数据来发自己的文章呢? 公共数据库挖掘呀! 众所周知,TCGA和GEO是最著名的两大公共数据库,前者主要存储高通量(二代测序)数据的肿瘤样本数据(TCGA的0代码可视化 ...

  • 第75天: Python 操作 Redis 数据库介绍

    Redis 作为常用的 NoSql 数据库,主要用于缓存数据,提高数据读取效率,那在 Python 中应该如果连接和操作 Redis 呢?今天就为大概简单介绍下,在 Python 中操作 Redis ...

  • 第78天: Python 操作 MongoDB 数据库介绍

    MongoDB 是一款面向文档型的 NoSQL 数据库,是一个基于分布式文件存储的开源的非关系型数据库系统,其内容是以 K/V 形式存储,结构不固定,它的字段值可以包含其他文档.数组和文档数组等.其采 ...

  • 疫苗设计数据库介绍

    随着疫情的发展,目前对于新冠疫苗相信很多人都有一定了认识.当然在新冠之前也就存在其他疾病的疫苗了.疫苗的接种可以有效的防止我们受到其他物种感染的影响.之前常见的还有天花疫苗,HPV疫苗这类.因此对于很 ...

  • GEO数据库使用教程及在线数据分析工具

    GEO数据库全称GENE EXPRESSION OMNIBUS,是由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库.它创建于2000年,收录了世界各国研究机构提交的高通量基因表达数据,也就 ...

  • EDQM数据库介绍

    EDQM数据库介绍

  • DEAP数据库介绍--来自于音乐视频材料诱发得到的脑电数据

    更多技术干货第一时间送达 DEAP数据库简介 DEAP[1](Database for Emotion Analysis usingPhysiological Signals),该数据库是由来自英国伦 ...