如何快速了解一个人体基因的所有信息 (一)
写在前面
在进行基因相关研究的时候,我们经常需要查询了解基因的相关功能,才能知道我们要往哪里进行下一步研究。对于基因功能的查询,我们介绍过ncbi的gene数据库,同样的之前的gene id转换的时候我们也提到过,关于基因信息的汇总除了gene数据库还有ensembl、uniprot等等很多数据库,各个数据库都提供了不同的基因信息。我们在查询的时候,总不能说把各个数据库都查询一遍吧?所以今天就给大家介绍一个汇总了多个数据库的基因信息查询网站: GeneCards (https://www.genecards.org/)
GeneCards 是一个汇总了150个网络数据库的基因功能查询数据库。通过这个数据库我们可以查询到一个基因各个方面的基本功能(主要注意的是这个数据库只能查询人的基因信息哈)。
这类汇总性的数据库,最担心的是数据库的不更新,但是由于genecards所在的公司还有很多功能是付费的,算是一个营利性的机构,所以为了机构的名声,他们也会长时间更新的,目前已经到了4.14版本了。
由于查询的信息比较多,所以我们分两期来进行讲解。
数据库的使用很简单,就是输入我们想要检索的基因即可。这里我们可以输入基因名、ensembl ID、uniprot ID都可以,例如我们这里输入MYC。
检索完之后,我们就可以看这个基因相关的信息了。对于基因的信息,数据库分成了很多个部分。现在基本上分成基因基本信息以及基因实验相关的产品信息。我们这里主要的就来介绍数据库包括那些基本信息。
很多数据库对于基因的功能都会有简单的汇总介绍,通过这句话我们基本上能大概的了解这个基因的基本功能。在Summaries这个模块当中,genecards汇总了多个数据库对于这个基因功能的总结,我们通过这个就可以知道多个数据库对于这个基因是什么评价的了。
按照中心法则,一个基因有三个不同的身份:分别是DNA、mRNA、蛋白。对于这三个身份都有信息。因此genecards也基于三个不同身份有了三个不同的模块: Genomics、Transcripts、Proteins
Genomics
在基因组这个模块当中,我们可以看到目标基因在基因组当中的位置及长度。
另外,由于基因组对于基因表达的调控,主要是通过转录调控来实现的,所以数据库总结了很多转录调控的信息。我们在这里就可以查询到这个基因可能收到哪些转录因子的调控。
Transcripts
由于可变剪切的存在,基因的mRNA会产生很多的剪切异构体,所以这个数据库汇总了多个数据库对于剪切异构体的ID,以及相对应的可能剪切方式。
另外,我们在做相关的基础实验的话,需要对这个基因的mRNA进行处理,具体处理的话就需要用到公司的试剂。所以这里也 汇总了相关可能用到的试剂,例如CRISPR、miRNA等等。
Proteins
对于基因蛋白,同样的也是汇总了蛋白的基本信息。另外关于蛋白的调控,也存在翻译后调控,所以 GeneCards 利用 UniprotKB,neXtProt 和 GlyConnect 三个数据库注释了相关的翻译后调控信息,另外还通过PhosphoSitePlus注释了其磷酸化位点。
对于蛋白相关的功能研究,我们会用到相关的抗体,所以这里也总结了关于各个公司抗体的型号。