GEO和ArrayExpress数据库资源惊人

写在大年初一

昨晚大年三十跟几个实习生还有学徒一起看春晚,间隙刷了下手机,太多祝福语,春晚结束后临睡前的12:30我还是拿起手机一一回复了,虽然可能是群发的,但毕竟是心意。

今早起来去楼下电影院看了个《侍神令》,结束后又收到了一大堆拜年信息,唉,这次没有回复了。不过,倒是也捡到几个红包,很开心。其实如果真的要祝福我,直接在我们《生信技能树》留言是最好的,我看公众号的频率远超于我的私人微信。(期待看到你的留言)

正文

春节期间刷文献,看到文章《OCTAD: an open workspace for virtually screening therapeutics targeting precise cancer patient groups using gene expression features》,链接是:https://www.nature.com/articles/s41596-020-00430-z  提到了GEO和ArrayExpress数据库资源,以前没有概念,看完之后,大吃一惊啊:

  • The Gene Expression Omnibus (GEO; https://www.ncbi.nlm.nih.gov/geo/) from the National Center for Biotechnology Information is a public functional genomics data repository consisting of over 3 million samples from over 110,000 studies as of September 2019.
  • ArrayExpress (https://www.ebi.ac.uk/arrayexpress/) is another functional genomics dataset that has over 55 TB of data from over 70,000 experiments as of September 2019.

有些粉丝问到我们《生信技能树》提供的GEO中国区镜像其实名不符其实,因为仅仅是包含了几万个表达量芯片的数据集,并不是全部的GEO数据库的备份。哪怕是我最近升级了,见:你的GEO中国区镜像该升级啦,也不敢备份其它类型数据。

实在是囊中羞涩,仅仅是这些表达量芯片矩阵就耗费了我三万块钱了,如果是全部的十几万个数据集,各种NGS组学数据,成本起码得除以1000,我目前还真拿不出几千万的闲钱来做公益。而且还有ArrayExpress 的55 TB 数据,我看都不敢看!

(0)

相关推荐

  • [1]Big data哪里找?

    欢迎来到医科研,这里是白介素2的读书笔记,跟我一起聊临床与科研的故事, 生物医学数据挖掘,R语言,TCGA.GEO, SEER数据挖掘. 作者:白介素2 继续坚持阻击疫情,从我做起,坚持原地不动.读读 ...

  • 周末做什么【9-10/2/2019】

    题图是2019-02-07上午收到的包裹, 我募资即将靠近目标, 收到"愿望成真"给我寄来的慈善跑步短袖. (跑步训练日穿起来) 对谈 GEO 教案 慈善午餐会 1. 对谈 这一次 ...

  • 除了GEO,其实我们还可以挖掘这个数据库

    很多人知道都GEO这个数据库,但是很多人忽略了这个数据库,这个数据库是什么呢?那就是--ArrayExpress ArrayExpress是什么? ArrayExpress是主要科学期刊推荐的存储库之 ...

  • 向GEO数据库提交数据-你想知道的都在这

    欢迎来到医科研,这里是白介素2的读书笔记,跟我一起聊临床与科研的故事, 生物医学数据挖掘,R语言,TCGA.GEO.SEER数据挖掘. . 1. GEO数据库是什么? GEO数据库是免费的公共数据库, ...

  • 如何进行GEO临床数据查询

    推荐两个可以进行GEO临床数据下载的网址 乔治敦癌症数据库(G-DOC)(https://gdoc.georgetown.edu/gdoc/),G-DOC是一个精准医学平台,其中包含来自一万多个患者和 ...

  • 【生信挖掘】浅谈生信入门学习知识

    生信已经成为科研圈发SCI的神器了,检索PubMed上可见发表的文章不管高分低分都涉及生信,甚至南通大学2016级临床本科生张波发表21篇SCI,从影响因子 15分(2020年发表,实时IF 26分) ...

  • 除了套路分析你还可以这样发生信文章!

    All of gene expression (AOE): An integrated index for public gene expression databases全基因表达(AOE):公共基 ...

  • 干货 | 十个线上免费开放的数据库资源|图书|资源库|文献|图书馆|读秀

    大外交·青年智库 大外交青年原创学术交流与实践服务 Glory Diplomacy Ny.2021 / No.505 媒体合作 | 学术原创投稿 | 广告联系 邮箱:fydwjzhuanyong@12 ...

  • lncRNA必知必会的数据库资源大全

    最近有粉丝来信表示我的免费视频课程<LncRNA-seq数据>非常的"简陋",就是在用一个lncRNA芯片和一个lncRNA测序的数据来演示如何获得表达矩阵,以及后续的 ...

  • 基于小鼠的基因集数据库资源

    应该是生命科学领域的研究绝大部分情况下都不是绝对的,很多情况下我们可以偷个懒进行普通的人鼠基因转换之首字母大写转换即可,比如单细胞水平下面的标记基因可视化.但是有一些时候,我们也需要认真,比如进行基于 ...

  • 表达量矩阵并不一定要上传到GEO或者ArrayExpress

    最近在系统性整理单细胞转录组图谱计划,发现了一个有意思的数据共享方式,就是2018的小鼠单细胞图谱,文章标题是:<A single-cell transcriptomic atlas chara ...

  • [汇编资源]肿瘤相关数据库资源汇编合集

    欢迎来到医科研,这里是白介素2的读书笔记,跟我一起聊临床与科研的故事, 生物医学数据挖掘,R语言,TCGA.GEO, SEER数据挖掘. Cancer-related Data Resources A ...

  • 124种~综合类资源数据库大汇总

    数据库简介 序号 数据库名称 文献类型 简介 数据类型 链接 1 2 宁波图书馆宁波特色数据库 图书/报纸 宁波市图书馆的数字化资源,主要有馆藏老报纸.<申报>中的宁波史料.宁波文史资料. ...

  • 分享交流:如何囤资源——期刊论文、专业书籍、课程资源 |GEO读者来信

    题图由作者本人提供:重庆云阳县 龙缸景区(2017.2) 陶理写在前面: 这篇文章是一封意外的惊喜(因为我基本上都快忘了这回事).就像我早就习惯用心准备的原创推送基本上阅读量很低而且没什么人点赞一样, ...

  • 重磅!中文版GEO数据库来了!

    没有样本,没钱测序,如何拿别人的数据来发自己的文章呢? 公共数据库挖掘呀! 众所周知,TCGA和GEO是最著名的两大公共数据库,前者主要存储高通量(二代测序)数据的肿瘤样本数据(TCGA的0代码可视化 ...

  • 全球免费电子图书馆名单,60个免费学术资源数据库送给你,留存吧

    全球免费电子图书馆名单,60个免费学术资源数据库送给你,留存吧