像字典一样的药物靶点与生物活性关系查询,ChEMBL数据库给你不一样的体验

ChEMBL数据库是欧洲生物信息研究所(European Bioinformatics Institute,EBI)开发的一个靶点与生物活性药物数据库,收集的是药物研究和开发过程中的药物化学数据和知识,比如临床实验药物和批准药物的治疗靶标和适应症,旨为药物化学家们提供一个非常便利的查询靶点或化合物的生物活性数据的平台。截至2019年10月29日,该数据库共收集了12482个靶点,1,961,462个不同的化合物和13,382个靶点信息。
ChEMBL数据库信息统计
ChEMBL也有一些小分子及其生物活性的信息,它们来自核心药物化学期刊的全文文章,并与已批准的药物和临床开发候选药物的数据(如作用机制和治疗适应症)相结合,做到权威与实用的完美结合。
ChEMBL
https://www.ebi.ac.uk/chembl/
下面我们通过两种方式进行数据库的使用:

一、Browse all CHEMBL

浏览CHEMBL

在主页又下角,找到Browse all CHEMBL按钮,即可进入 CHEMBL 数据库的浏览模式。
展列的数据效果如下,左边有过滤器,出现1961462个化合物,左边的“Filters”窗口是筛选器,列出了对这1,961,462小分子的各种特性的统计,包括分子类型(Type)、名称(name)最大临床试验期(Max Phase)、Alogp等,并且允许用户通过点击相应的数值浏览给定范围内的原始数据子集。我们可以按照自己需求通过某一种类型进行筛选、排列,点击右上角的下载按钮就可以直接下载了:
也可以换成表格的形式看:
点开一个小分子CHEMBL3927695,提供参考的信息有这么多:
01 基本信息:
02 化合物的SMILES结构式:
03 替代形式:
04 类似化合物:
05 靶标预测:
PS:靶标预测结果返回有四个类:“active”: 化合物与靶标有相互作用;“inactive”,化合物与靶标没有相互作用;"empty": 模型无法预测化合物与靶标的关系;"both": 模型不能得出结论。预测的可信度分为70%,80%和90%三个档次。
06 理化属性:
07 UniChem连接层交叉引用:

二、SEARCH ChEMBL

搜索ChEMBL

ChEMBL的搜索形式有三种:
第一种是在搜索框直接输入名称;(化合物,靶点,细胞系或组织等)
第二种是自行绘制结构:
点击“Draw a Structure”可以画出化合物的结构,或者点击打开文件的图标,上传化合物结构文件(可以是sdf文件或smiles结构式)。
系统默认搜索与输入化合物相似性分大于等于95%的化合物,可以左右滑动Similarity按钮下面的滑块进行修改,然后点击Similarity按钮。若只查询本化合物,则将相似性分设置为100%.
第三种是输入序列:
用上面这三种方法搜索到的内容和浏览看到的一样,这里就不放出来了。
下面是数据库提供下载的数据,在导航栏的dowload,网址是:
https://chembl.gitbook.io/chembl-interface-documentation/downloads
总之,通过该数据库,我们可以快速查询到某个靶点目前以报道的化合物及其活性信息,也可以查询某个化合物在哪些靶点做个生物活性测试及其数据。这些数据都来源于各种已报道的文献,数据较为可靠,且能够溯源,查询到数据的出处。通过该数据库,可以节省大量查阅文献和收集化合物数据的时间,快速获取准确的化合物及其生物学数据,进一步加速药物设计和药物开发的速度,喜欢的小朋友记得收藏。
References:
ChEMBL: towards direct deposition of bioassay data.
Mendez D, Gaulton A, Bento AP, Chambers J, De Veij M, Félix E, Magariños MP, Mosquera JF, Mutowo P, Nowotka M, Gordillo-Marañón M, Hunter F, Junco L, Mugumbate G, Rodriguez-Lopez M, Atkinson F, Bosc N, Radoux CJ, Segura-Cabrera A, Hersey A, Leach AR.
— Nucleic Acids Res. 2019; 47(D1):D930-D940. doi: 10.1093/nar/gky1075
Chinese medicine. Nucleic Acids Res. 2018 Oct 26. doi: 10.1093/nar/gky987.
(0)

相关推荐