TCGA-miRNA批次矫正后数据集介绍
前段时间,我们对于批次效应有关的东西进行了一些介绍。其中包括
对于经常使用的TCGA数据库而言,同样也有批次效应存在。对于这样的批次,在公布之前也经过一定的处理的。但就和我们之前介绍的
由于我们在进行批次去除的时候,我们在定义批次分组的时候也只是基于我们的自己了解的情况进行定义的。但是每个数据集具体的情况不是很清楚。所以有可能也会出现在尝试着去除批次之后,发现其实不同组织类型的样本也并没有区分的很开的情况。就比如我们在去除批次之后的这个正常样本。
对于TCGA的数据同样也可能存在这样的情况。最近有人把TCGA-miRNA的数据进行了重新批次效应的检测和分析
按照这个文章来说,经过分析,能看到与正常样本相比,肺肿瘤组织中报告的肿瘤抑制性 isomiRs 的显著下调。这个也说明了批次去除的重要性。
关于这个结果对于我们来说不是很关心的,重要的其实还是作者把重新去除批次的数据放到来了GEO数据库里面(GSE164767),在这个里面就可以下载作者重新分析后的数据了。
GSE164767
在GSE164767 当中,我们可以在Overall Design 当中了解作者是具体怎么分析数据的。
在这个里面主要是要确定的是对于IsomiR的过滤。
因为下面作者在提供分析后的数据的时候,也是基于这个标准来的。
好了,以上就是这个数据集的简单介绍了。如果要有分析TCGA-miRNA数据的话,除了最基本的数据分析。同时也可以参考使用这个数据试一下的哈。
赞 (0)