什么,你感兴趣的GEO数据集没有关联到原始文献出处
一般来说,想挖掘GEO数据库的公共数据集,最后发表时候都要引用该数据集的原始文献。一个GSE数据集会关联到一个原始文献,比如:
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE90604
可以看到其关联的文章是:Simultaneous miRNA and mRNA transcriptome profiling of glioblastoma samples reveals a novel set of OncomiR candidates and their target genes. Brain Res 2018 Dec 1;1700:199-210. PMID: 30176243
甚至一个GSE数据集关联更多文献,如果这个数据集被挖掘过。比如:
当然,并不是说这个GEO数据集被多次挖掘,就一定要关联到多个文章,比如:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE4107 它其实至少被挖掘了五次。
更严重的是有些时候,你感兴趣的GEO数据集没有关联到原始文献出处。比如:
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE104267
如下所示:
GEO数据集没有关联到原始文献出处
其实可以,根据作者单位,上面写的是:顾建钦. Jianqin Gu. 河南省人民医院. Henan Provincial People 's Hospital
或者搜索 邮箱;dangyuan830307@hotmail.com 多次反复搜索,查到了对应的真实作者:Dang, Yuan dangyuan830307@hotmail.com
World J Surg Oncol. 2015 Oct 1 Expression and clinical significance of long non-coding RNA HNF1A-AS1 in human gastric cancer. World J Surg Oncol. 2018 Mar Evaluation of the expression and clinical value of lncRNA AC010761.9 in human gastric adenocarcinoma.
其实上面我举例的第一个例子最开始也是没有关联文献的,我当时是谷歌搜索:Sukru Gulluoglu Yeditepe University
https://www.researchgate.net/profile/Sukru_Gulluoglu https://sg.linkedin.com/in/sukru-gulluoglu-42576827 https://scholar.google.com.tr/citations?hl=en&user=COkIAXYAAAAJ&view_op=list_works&sortby=pubdate
甚至还能查到作者的其它数据集:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE88721
我们感兴趣的数据集相关文章应该是:https://www.sciencedirect.com/science/article/pii/S0006899318304578?via%3Dihub 作者的差异分析结果是:1332 genes and 319 miRNAs were found to be dysregulated by the microarrays. 正文清清楚楚的提到了:GEO Series accession number GSE90604 (https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE90604).
然后我联系了GEO官方,把这个文献关联上去了这个数据集页面。
嘻嘻,如果你在挖掘GEO数据集的同时,也发现了那些并没有关联到原始文献的,而且你成功找到了就通知一下GEO官方哈。