精选十个权威化合物信息数据库
1、PubChem http://pubchem.ncbi.nlm.nih.gov
PubChem 检索可得到的结果包含了分子式、SMILES、2D和3D结构、InChI和InChIKey、相对分子质量、脂水分配系数、氢键受体和供体数目、可旋转键数目、互变异构体数目等基本的结构信息和物化性质,除此以外,还有该化合物作为药物的剂型和商品信息、药理性质、毒性、生物活性检测等信息,并通过文献分类副标题可以查看相关文献。
PubChem数据库于2004年正式对方开放使用,这是一个可以免费获取使用的数据库,其中包含了很多与有机小分子化学结构及其生物活性相关的信息。它包含了结构、命名和计算物理化学数据,并与NIH PubMed/ Entrez信息链接。
PubChem的数据信息被划分成三个相互关联的数据库,即PubChem Substance、PubChem Compound和PubChem BioAssay,这三个数据库都隶属于NCBI的Entrez信息检索系统。
2、ChemSpider http://www.chemspider.com/
ChemSpider是一个隶属于英国皇家化学会的汇总数据库,包含了来自不同资源提供的五千五百多个化合物信息。现在,该数据库含有的信息包括海洋天然产物数据、ACD实验室化学数据库、EPA的DSSTox数据库以及来自不同供应商的一系列化学物质信息。数据库拥有多种搜索工具,而且大多数化合物都有计算物理化学性质值。
数据库提供以下查询方式:标准查询方式包括系统名称、商业名称和同义词、登记号查询;高级查询方式提供互动式搜索,通过化合物结构、化合物子结构,分子式以及分子量、CAS编号、供应商等进行高级搜索。还可以对搜索得到的结果进行进一进步的筛选以限定更小的搜寻范围;ChemSpider还提供以iOS软件应用(iPhone/iPod/iPad)为平台的移动设备搜索。同时也支持安卓系统。
3、Phenol-Explorer http://phenol-explorer.eu/
Phenol-Explorer是第一个专门为食品中多酚含量创建的综合数据库。数据库中含有400种食物中500个不同多酚类物质的35,000多个含量值。这些数据信息是从1,300多篇科学文献当中提及的60,000多种原始含量值中提取而来。在从论文提取数据之前,每一篇论文都经过了严格认真的审查和评估。用户可以查询经过各种分析方法鉴定得到的食品、多酚和代谢物。
4、ZINC http://zinc.docking.org
包含2000多万个化合物分子,适用于虚拟筛选。通过ZINCID、SMILES格式等进行检索,检索结果中给出了化合物的结构,一些化合物的重要性质,包括xlogP,溶解度,氢键给体和受体数目等,以及二维和三维结构,供应商信息。用户可以自行绘制或输入分子的SMILES字符串来上传待检索的分子,同时,还可以限定净电荷量、xLogP、可旋转键数、氢键供体和受体数等参数范围。库中的分子结构均可被免费下载,支持SMILES、mol2、3DSDF和DOCK flexibase格式,并且化合物的相关信息可以以表格形式下载,便于用户使用。
5、DrugBank http://www.drugbank.ca
药物信息包括了该药物的CAS号、商品名、分子式、分子量、SMILES、2D和3D结构、logP、logS、pKa、熔点、吸收性、Caco-2细胞穿透性、药物类别和临床使用、性质描述、剂型与给药途径、半衰期、体内的生物转化、毒性、作用于哪些生物体、食物对服用的影响、与其它药物的相互作用、作用机理、代谢途径、药理学特征、与蛋白质的结合情况、溶解度、物质形态、同义词、关于合成的相关文献等,还与ChEBI、GenBank、PubChem等外部数据库有链接。
6、Toxnet http://toxnet.nlm.nih.gov/
Toxnet是美国国家医学图书馆(nlm)的化合物毒性相关数据库,包括药品毒理学、危险化学品和其它相关领域的信息,从Toxnet可对下列子数据库进行检索:
HSDB (危险化合物数据库):内含4500种毒性(或可能具有毒性的)化学药品,以及其毒性、对环境的影响、化学安全性、废弃物处置等相关领域的信息。
TOXLINE® :包括药物和其它化学物质的生物化学、药理学、生理学、毒理学的文献数据库。其中有300万条引文、几乎都有摘要和/或检索条、以及CA登录号。
ChemIDplus :对NLM数据库中的化学物质提供结构式和专业信息。
7、Drug future http://www.drugfuture.com/toxic/
RTECS主要包括以下六大类化学物质的毒性数据:直接刺激性(Primary irritation);致突变性(Mutagenic effects);对生殖的影响(Reproductive effects,即致畸性);致肿瘤性(Tumorigenic effects);急性毒性(Acute toxicity);其他多剂量毒性。
其中记录有该化学物质的数值毒性值,如半数致死量(LD50或LC50),最低中毒剂量(TDLo),最低中毒浓度(TCLo)等,以及实验所使用的物种和给药途径。除此之外,所有的数据也都列出了其文献来源,然而并没有对其有任何的评估。
该数据库中数据大部分都较为久远,一些较新的化合物不被列入;此外,此数据库查询时会有一些bug,如需查询一个化合物,最好通过不同方式如CAS号,通用名多次查询,因为有些化合物可能通用名查不到,CAS号却能查到。
8、ChemBlink http://www.chemblink.com/indexC.htm#opennewwindow
首页检索(该数据库检索与Drug future-化学物质毒性数据库类似,需通过CAS号和化学名等多次检索,有时候CAS号搜不出来,化学名可以,如下面CAS号搜索没有结果,但是用化学名Tetrabutylammonium bromide就可以得到结果):提供化合物的安全技术说明书(MSDS),说明书中毒性一栏(Toxicological Information)会提供化合物的一些毒性数据。
9、Chemical Book http://www.chemicalbook.com/
ChemicalBook是一家致力于为化学行业用户提供最有价值信息的资源平台,平台可以使用使用中文名称,CAS号,英文名称,分子式,分子量,MDL号,EINECS号,结构式等多种方式检索,提供供化合物的安全技术说明书(MSDS),说明书中毒性一栏(Toxicological Information)会提供化合物的一些毒性数据。
10、MOLBASE http://www.molbase.com/
最初是中科院内部使用的数据平台。其商用版网站摩贝网(MOLBASE)于2013年9月上线,为一个化学品电商综合服务平台。其中包含了化合物的百科信息,内容涵盖了以上介绍的一至多个数据库,如Drugfuture-化学物质毒性数据或MSDS。该平台的特点就是可以通过化学结构查询化合物,因此可以搜索不知道CAS号的化合物,画结构式的工具简单上手。
(
(文章素材来源:化学数据联盟)