GEO和ArrayExpress数据库资源惊人
写在大年初一
昨晚大年三十跟几个实习生还有学徒一起看春晚,间隙刷了下手机,太多祝福语,春晚结束后临睡前的12:30我还是拿起手机一一回复了,虽然可能是群发的,但毕竟是心意。
今早起来去楼下电影院看了个《侍神令》,结束后又收到了一大堆拜年信息,唉,这次没有回复了。不过,倒是也捡到几个红包,很开心。其实如果真的要祝福我,直接在我们《生信技能树》留言是最好的,我看公众号的频率远超于我的私人微信。(期待看到你的留言)
正文
春节期间刷文献,看到文章《OCTAD: an open workspace for virtually screening therapeutics targeting precise cancer patient groups using gene expression features》,链接是:https://www.nature.com/articles/s41596-020-00430-z 提到了GEO和ArrayExpress数据库资源,以前没有概念,看完之后,大吃一惊啊:
The Gene Expression Omnibus (GEO; https://www.ncbi.nlm.nih.gov/geo/) from the National Center for Biotechnology Information is a public functional genomics data repository consisting of over 3 million samples from over 110,000 studies as of September 2019. ArrayExpress (https://www.ebi.ac.uk/arrayexpress/) is another functional genomics dataset that has over 55 TB of data from over 70,000 experiments as of September 2019.
有些粉丝问到我们《生信技能树》提供的GEO中国区镜像其实名不符其实,因为仅仅是包含了几万个表达量芯片的数据集,并不是全部的GEO数据库的备份。哪怕是我最近升级了,见:你的GEO中国区镜像该升级啦,也不敢备份其它类型数据。
实在是囊中羞涩,仅仅是这些表达量芯片矩阵就耗费了我三万块钱了,如果是全部的十几万个数据集,各种NGS组学数据,成本起码得除以1000,我目前还真拿不出几千万的闲钱来做公益。而且还有ArrayExpress 的55 TB 数据,我看都不敢看!
赞 (0)