12月在线数据库汇总
在12月期间,总共发表了医学相关在线数据库47个。下面就来给大家介绍一下主要有哪些数据库,以及笔者比较感兴趣的数据库。如果想要所有相关数据库信息的,后台回复:2012。
1. 疾病与药物相关数据库
疾病和药物相关的数据库一共有5个。涉及到多种不同的疾病。
其中,HERB是一个基于高通量测序来检测重要作用机制的数据库。数据库里面收集了多种中药实验来进行二代测序的数据。进而可以观察不同的中药可能的分子机制。
另外一个是一个储存X线公共数据数据库。在这里储存了从2009年到2017年由西班牙圣胡安医院放射科医师解读和报告的67000名患者的超过160,000张X线的图像和临床信息。如果是研究影像的机器学习这类的,可以把这个当作自己的外部数据集来用,总共还1T的数据,数据量还是很大的。
2. 微生物和病毒相关数据库
在这个部分,总共发表了7个有关的数据库。其中和新冠有关的数据库有两个。
另外还有一个HumanMetagenomeDB数据库是一个储存人类共基因组数据的数据库。相当于在SRA和GEO里面把和宏基因组有关的数据汇总到一起了。这样我们就可以在这里进行快速的检索了。不过这类的数据库,后续的数据更新是一个问题,如果一直不更新的好,还是原始数据库好用一些。
3. DNA相关数据库
在DNA相关的数据库当中,一共有5个相关的数据库发表。其中包括和变异注释数据库,还包括DNA甲基化数据库。
关于甲基化相关的这个数据库:MethHC 2.0是一个更新过的数据库。主要可以用来查找在癌症当中甲基化和表达的相关性的分析。
4. RNA相关数据库
12月份一共发表了12个和RNA相关的数据库。其中包括经典数据库Refseq的更新。在这12个数据库当中,有6个是和lncRNA有关的。之前的很多关于lncRNA的数据库及与bulk RNA-seq构建的。现在有了scRNA-seq了。所以也就出现了利用单细胞测序来构建相关数据库了。
在12个数据库里面,有一个miRNA靶点预测的数据库。我们知道关于miRNA靶点预测的数据库有很多,但是每个数据库都有每个数据库的特定输入等?这个数据库其实就类似一个选择指南,在我们选择好想要怎么预测之后,就可以告诉我们可以使用哪些数据库了。
5. 蛋白相关数据库
12月总共有13个蛋白相关数据库发表。其中uniprot这个经典的蛋白查询的综合性网站也有更新。另外还包括两个本征无序态的蛋白质数据库。
6. 流程化数据库
在流程化分析的数据库当中,只有一个用来分析蛋白组学数据的差异分析和富集分析的数据库。
7. 其他数据库
这次还有4个和以上都没多大关系的数据库。
其中有一个预测诊断标志物的数据库。对于这类的数据库,我们之前介绍过两者。这个数据库和之前的区别是,它可以预测不同组学的诊断标志物,包括化学物质、蛋白和基因表达等等。
另外还有一个用来去除批次效应的工具。我们知道在进行不同批次的数据分析的时候,第一步还是要去除批次效应。这个往往需要用到R语言来进行去除。这个软件其实相当于提供了一个不需要编程就可以去除批次的工具。