GEO数据库的这个功能你知道吗

不知不觉在单细胞转录组领域做知识分析也快两年了,很幸运聚集了一些小伙伴携手共进,我们承诺不间断更新5个月,把我们这两年的学习成果全部掏出来给大家,希望大家都能有所收获!当然也欢迎大家加入我们,勇于分享。

你现在看到的是随机投稿栏目!

大家都想学单细胞转录组数据处理,可是如果你不会R语言,没玩过GEO数据库挖掘,没有这些背景知识点,你会学的很辛苦,所以这里接受大家的投稿带领大家一起学习R及bioconductor技能!!!

首先来一个简单的GEO数据库挖掘吧!

前言

今天在技能树学徒班听了一节关于GEO数据库的课,GEO是什么,又是一头雾水,强迫基因受环境影响出现短暂的表达,赶紧搜索了解下,GEO(Gene Expression Omnibus database)是由NCBI负责维护的一个数据库,设计初衷是为了收集整理各种表达芯片数据,但是后来也加入了甲基化芯片,lncRNA,miRNA,CNV芯片等各种芯片,甚至高通量测序数据,从文章拿到了GSE的study ID号,登录GEO网站,输入GSE的study ID,就可以看到关于该study的所以描述信息,是用的什么测序平台,测了多少个样本,数据分析等等(GEO的解释摘自于生信菜鸟团的整理:http://www.bio-info-trainee.com/tag/geo)

GEO2R分析

但是有些GSE序列在GEO网站没有提供GEO2R分析(如GSE111229)。

利用GEO数据库的GEO2R工具分析一个GSE的study ID,操作如下:

  • 登录GEO官网
    https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?

  • 输入study ID号
    GSE24673 点击“Go”

  • 用GEO2R分析,翻到最底页,就会看到有蓝色图标“Analyze with GEO2R”点击运行。

  • 分组,这里分两组,输入英文名字后,按enter键

  • 分别命两个组的名字,自己命名如“tumor”,“normal”

  • 选中3个GSM序列放到tumor里,归为第一组。

  • 选中4个GSM序列放到normal里,归为第二组

  • 点击运行,翻到页底,点击“top 250”运行。

  • 运行中,这过程有点慢,需要耐心等待...

  • 查看结果1,运行好之后会主动展现一些结果。

  • 查看结果2,根据自己想要查看的结果,可以输出(保存)已分析好的结果。

  • 也可根据自己的需求查看其它运行的代码,比如查看R脚本,而且可以复制。如果在操作上有不懂的,可以看GEO官网上的视频,视频里有整个过程的详细讲解,点击“YouTube”。

结语

今天感谢生信技能树齐老师的授课与指导。

同时如果你对单细胞转录组研究感兴趣,但又不知道如何入门,也许你可以关注一下下面的课程

(0)

相关推荐

  • 【生信笔记】查找GEO数据集

    A 什么是GEO数据库? GEO数据库全称Gene Expression Omnibus database,是由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库.它创建于2000年,收录了世 ...

  • 少走弯路!按这个铁死亡生信套路走,二区近6+SCI收入囊中!(附详细操作步骤)

    解螺旋公众号·陪伴你科研的第2598天 铁死亡 铁死亡是近些年来新发现的一种细胞死亡的新形式,与多种疾病.肿瘤和损伤密切相关,近几年在此方向的国自然项目逐渐增多.今天想和大家一起学习2021年2月发表 ...

  • GEO数据纯生信准3分SCI思路

    研究背景: 卵巢癌在全球与妇科癌症相关的死亡中排名第五.到目前为止,尚未完全了解卵巢癌的肿瘤发生和预后的分子机制.这项研究旨在发现参与卵巢癌的hub基因和治疗药物. 研究方法: 从Gene Expre ...

  • GEO(Gene Expression Omnibus):高通量基因表达数据库

    #GEO是什么? GEO全称Gene Expression Omnibus data base,由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库(通过NCBI首页,All Database ...

  • 重磅!中文版GEO数据库来了!

    没有样本,没钱测序,如何拿别人的数据来发自己的文章呢? 公共数据库挖掘呀! 众所周知,TCGA和GEO是最著名的两大公共数据库,前者主要存储高通量(二代测序)数据的肿瘤样本数据(TCGA的0代码可视化 ...

  • GEO数据库使用教程及在线数据分析工具

    GEO数据库全称GENE EXPRESSION OMNIBUS,是由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库.它创建于2000年,收录了世界各国研究机构提交的高通量基因表达数据,也就 ...

  • 从GEO数据库下载得到表达矩阵 一文就够

    在第一讲我们详细介绍了GEO数据库的基础知识及规律,也了解了如何利用官方R包GEOquery来探索GEO数据库,当然,我的生信菜鸟团博客里面也从很多其它角度解析过它,欢迎大家自行搜索学习.总得来说,从 ...

  • 一万人陪你学习GEO数据库挖掘知识(公益视频听课笔记分享)

    耗费半年的时间精心制作了成套的生物信息学入门视频教程,并且在生信技能树联盟平台发布了这个长达74个小时全套生物信息学入门视频:生信技能树视频课程学习路径,这么好的视频还免费! 在B站看了看,大家学的热 ...

  • GEO数据库中国区镜像横空出世

    接收到太多的粉丝求助,想下载个表达矩阵做一下数据挖掘偏偏第一步就卡在了,数据文件下载半天毫无动静,或者下载到99%就卡死了.如果我恰好在电脑旁,通常会帮忙下载后微云或者百度云传递给粉丝,但这毕竟不是长 ...

  • GEO数据库中国区镜像奔走相告啊

    最近还是大量粉丝留言表示自己因为疫情困在家里,想做数据挖掘混个本科毕业论文,但是看完我的GEO数据挖掘视频后,想下载个数据集,就被卡死了,实在是巧妇难为无米之炊! 这个不怪大家,我给大家的免费的GEO ...

  • 读取GEO数据库的单细胞转录组表达矩阵文本文件的一种方式

    最近在读AUCell包的文档,链接是:http://bioconductor.org/packages/release/bioc/html/AUCell.html,这个包的教程我已经写完了, 在 :使 ...

  • 上传数据到GEO数据库实战笔记

    师兄的文章要送审,编辑让把RNA-seq的数据传到GEO数据库上,今天就在传这个数据. 之前没传过数据,今天就是一边学一边搞这个. 一.注册账号 先注册一个GEO账号 二.准备工作 选择Data ty ...

  • 中文版GEO数据库来了!

    没有样本,没钱测序,如何拿别人的数据来发自己的文章呢? 公共数据库挖掘呀! 众所周知,TCGA和GEO是最著名的两大公共数据库,前者主要存储高通量(二代测序)数据的肿瘤样本数据(TCGA的0代码可视化 ...