你凭啥写“该基因在人体中高表达”--谁给你的勇气,梁静茹吗?

1

1

摸着你的良心,你有没有在文章的introduction里面煞有介事的介绍过某基因,你写“xxx基因是在人体中分布广泛、高表达且高保守的基因/蛋白,主要参与XXX等生物学过程”,套路,都是套路!

小编曾经也没头脑的写过这样的话,如今开始学了生信,好奇心就愈发控制不住了,那么我们到底凭什么才能明目张胆的下结论,认为一个基因是高丰度的呢?

今天以以下这篇有趣的文章为因子,我们来探索一下判定基因丰度的方法吧!

小声比比,这篇文章非常精彩哦~你是不是做过很多实验结果和主流的研究结果是矛盾的,做出来的结论和CNS文章的结论相反(泪流满面)

一直以来,大多数文献都报道MALAT1是一个促癌基因,而作者做出了相反结果,在一顿研究之后发现了之前报道文章的不妥之处,经过精心设计后,得到了一个圆满的答案。MALAT1其实是一个抑癌基因,前人使用的小鼠MALAT1缺陷模型,虽然MALAT1的表达缺失了,但MALAT1相邻基因的表达上调,正是这 上调的MALAT1相邻基因造成了促癌的后果。在更换新的MALAT1缺陷模型后,解开了MALAT1功能的面纱。

 基因数据库

NCBI

凡是涉及到基因相关信息,我们就会想到各式各样的基因数据库,一说到基因数据库就会忍不住想到NCBI,是的没错,我们打开NCBI查一查吧!结果如图:

MALAT1在人体不同组织中的表达,横坐标为sample,纵坐标为RPKM:RPKM是Reads Per Kilobase per Million mapped reads的缩写,代表每百万reads中来自于某基因每千碱基长度的reads数。RPKM是将map到基因的read数除以map到基因组上的所有read数(以million为单位)与RNA的长度(以KB为单位)。

假如reads长度是150 bp,测序深度30X,按照(30亿*30X的深度/150reads长度)=可得6亿条reads,那么根据图可知emm...这个MALAT1的每百万条reads里就有5-150条有MALAT1(Jimmy说RPKM到达100就算是高的了)。

NIH-GTEX

GTEx是一个收录正常人体组织的测序结果的基因数据库。搜索MALAT1后结果如下,可见MALAT1在正常人体组织中的TPM(Transcripts per million)是非常高。

GeneCards®: The Human Gene Database

GeneCards类似于各大基因数据库的搜索引擎和总结。搜索MALAT1--转到Expression section后结果如下:

如图可知MALAT1的RNAseq数据,其FPKM (Fragments Per Kilobase Million)含量也是非常高的。

综上所述,从三个基因数据库查阅得知,MALAT1确实是一个高丰度且分布广泛的基因。

只不过,RPKM、TPM、FPKM三个单位是不是让你傻傻分不清楚这是啥玩意儿,没错我也很好奇,所以狠狠的撸了一把StatQuest的教学视频,想要了解的小伙伴,留言让我知道~那我们还可以出一波RPKM、TPM、FPKM解说推文~~

好了,掌握了基因丰度查阅的方法,再撸一把RPKM、TPM、FPKM的含义,终于可以吹牛打草稿了~拜拜~~

1

END

1

■   ■   ■

(0)

相关推荐