GEO circRNA测序分析数据库
关于 GEO 这个大型的储存好多公共测序数据的数据库,我们在之前进行过详细的介绍[[GEO数据库数据库介绍]]。其中也介绍了可以通过 [[4.差异表达分析软件GEO2R]] 来对一些表达谱的芯片进行差异表达分析。但是在 GEO 里面不止 mRNA 的高通量测序的结果。还包括了一些 circRNA 这样的结果。对于这样的数据。由于涉及到 circRNA 转换这个问题。就没办法使用 GEO2R 进行相关的分析了。
因此也就有了类似于 [[circExp-GEO circRNA数据分析下载网站]] 这样基于 GEO 的circRNA 数据进行二次分析的数据库。对于 circExp 而言,我们之前也提到了。这个数据库有很多的问题。所以今天就给大家推荐另外一个综合性的分析 GEO circRNA 数据的数据库:circMine: http://hpcc.siat.ac.cn/circmine/home
背景数据集
在 circMine 当中,作者检索了 GEO 当中所有的 circRNA 的数据。最终收集了 87 个疾病在内的120个数据集。其中包括了多个组织的疾病。
所以,一般的 GEO 的 circRNA 的数据。都可以来这个数据库检索一下试试。
数据库使用
在 circMine 当中包括了多种使用场景。其中包括的就是数据检索和数据浏览的功能。
检索和浏览
在这两个功能里面,我们可以查看 circMine 主要包括了哪些数据集。例如在检索 功能里面就可以检索想要研究的疾病都有哪些数据集。比如我们想要知道胃癌有哪些数据集。直接选择胃癌即可。
在结果信息当中,包括了 收录的数据集的基本信息。同时作者还给每一个信息自己设定了一个变化(HSACMXXXXX)
circRNA 分析功能
除了数据集的检索之外,还要对这些circRNA 检测数据进行分析。在 circMine 里面就包括来多种分析功能了。
其中就包括基本的 差异表达,富集,共表达,靶基因预测这样等等等等。
这里就对==一般分析==进行简单的说明。在一般分析当中,我们可以分析数据集的差异表达情况,同时也可以进行火山图,热图的绘制以及富集分析。
在一般分析里面,我们首选要选择想要分析的数据集。这里需要输入的就是之前说的数据库自己的ID号。输入完之后就看到每一个样本的具体信息。
在进行下一步分析之前,需要定义想要分析的分组。这里的操作和 GEO2R类似, 首先定义分组,然后选择组内的样本。
在定义好分组之后,在后续分析的时候记得要把两个分组点上✅ 。
点上之后,在下面就可以选择自己想要分析的内容了。
比如我们想要做一个火山图看一下。就点击火山图,然后run一下即可。
总的来说
以上就是这个数据库的基本内容了。基本上包括了所有 circRNA 分析的所有基本内容了。如果大家在 GEO 里面发现了某一个 circRNA 测序数据想要分析的。可以尝试来这个数据库看一眼的。要是有的话,很快也就分析完了。