你只想做ID转换却不知道为什么要转换

最近咱们《生信技能树》的VIP答疑群,有这样的提问:

 

我觉得很有代表性,很多人仅仅是学了个皮毛,知道是需要进行ID转换,也能够运行代码。但是却搞不懂,不理解自己为什么进行ID转换,以及做了ID转换后是为了方便什么样的后续分析!

ID转换后我们才认识基因功能

在教程《研究最热门的基因是什么》里面,我提到了普通的词云展现的基因是 Entrez Gene,绝大部分人是没办法一目了然的去认识它,比如这个时候虽然知道研究最多的是7157和 7124 这两个基因,但是一般人是没办法认识这两个数字背后的基因啦。

所以,我们需要理所当然的做一个ID转换,如下所示的代码:

library(org.Hs.eg.db)
ids=toTable(org.Hs.egSYMBOL)
head(ids)
tbs=merge(ids,tb,by='gene_id')
wordcloud(words = tbs$symbol, freq = tbs$Freq, min.freq = 1,
          max.words=200, random.order=FALSE, rot.per=0.35,
          colors=brewer.pal(8, "Dark2"))

重新出图很清晰的看到了最热门的基因就是TP53

ID转换才能与其它数据库进行对接

这就是我们常见的GO/KEGG的数据库注释分析,我们这个时候并不会关心具体基因的名字,因为哪怕是正常的基因symbol,如果是成百上千个基因给到你,人力也是不可能是去全部记忆。但是把他们注释到数据库,就方便看他们整体的功能啦!

在:差异分析要的是表达量矩阵,基因名字并不重要啊,我提到过其实这样的注释并不一定要进行ID转换,因为只需要ID是一以贯之的即可:

 

通常情况下,我们是拿到了上下调基因集合,去做GO和KEGG数据库注释,如果是人类数据,下面是一个示例代码:

gene_up=rownames(deg[deg$avg_logFC>0,])
gene_down=rownames(deg[deg$avg_logFC < 0,])

library(org.Hs.eg.db)
#把SYMBOL改为ENTREZID,这里会损失一部分无法匹配到的
gene_up=as.character(na.omit(AnnotationDbi::select(org.Hs.eg.db,
                                                   keys = gene_up,
                                                   columns = 'ENTREZID',
                                                   keytype = 'SYMBOL')[,2]))
gene_down=as.character(na.omit(AnnotationDbi::select(org.Hs.eg.db,
                                                     keys = gene_down,
                                                     columns = 'ENTREZID',
                                                     keytype = 'SYMBOL')[,2]))

# 人家的包就是 entrez ID  设计
library(clusterProfiler) 
#对正相关基因进行富集分析
go <- enrichGO(gene_up, OrgDb = "org.Hs.eg.db", ont="all") 
library(ggplot2)
library(stringr)
barplot(go, split="ONTOLOGY")+ facet_grid(ONTOLOGY~., scale="free")+ 
  ggsave('gene_up_GO_all_barplot.png') 
go=DOSE::setReadable(go, OrgDb='org.Hs.eg.db',keyType='ENTREZID')
write.csv( go@result,file = 'gene_up_GO_all_barplot.csv')

#对负相关基因进行富集分析
go <- enrichGO(gene_down, OrgDb = "org.Hs.eg.db", ont="all") 
barplot(go, split="ONTOLOGY")+ facet_grid(ONTOLOGY~., scale="free")+ 
  ggsave('gene_down_GO_all_barplot.png') 
go=DOSE::setReadable(go, OrgDb='org.Hs.eg.db',keyType='ENTREZID')
write.csv( go@result,file = 'gene_down_GO_all_barplot.csv') 

如果是其它物种,尤其是小众的,可能是得自己慢慢摸索了。

那么lncRNA为什么可以不进行ID转换呢?

如果你是需要做GO/KEGG的数据库注释分析,其实绝大部分lncRNA本来就是并不会出现在主流的GO/KEGG的数据库,你把它的ID变来变去都是一样的结果哈!

大量lncRNA的功能是未知的,但是它们主要是cis-regulators,所以可以根据它们临近的蛋白编码基因功能来近似推断,然后表达量的相关性也可以类推到。

  • 如果是根据位置关系推断,使用bedtools等工具!

  • 如果是感觉表达量的相关性,可以看数据库。比如杂志Cancer Medicine, 2020的文章《 Genome-wide DNA methylation analysis by MethylRad and the transcriptome profiles reveal the potential cancer-related lncRNAs in colon cancer》,在进行结直肠癌相关lncRNA的功能富集分析,就是采用LncRN2Target v2.0和StarBase分析与15个lncRNA共表达的蛋白编码基因,其中lncRNA HULC和ZNF667-AS1分别鉴定到28个、9个共表达的蛋白编码基因!

文末友情推荐

与十万人一起学生信,你值得拥有下面的学习班:

(0)

相关推荐

  • clusterProfiler|GSEA富集分析及可视化

    GSEA(Gene Set EnrichmentAnalysis),即基因集富集分析,无需设定阈值来区分上调下调基因,使用所有的基因进行分析. GO 和 KEGG 可参考:R|clusterProfi ...

  • 手把手教你用R做GSEA分析

    GSEA是非常常见的富集分析方式,以前我们做GSEA需要用依赖java的GSEA软件,那个时候准备分析的文件可能要花上很长时间,报错还不知道如何处理.现在我们来学习一下R语言进行GSEA分析. 加载R ...

  • 来给lncRNA找一个新的研究方向

    我们知道,在lncRNA的研究当中,传统的lncRNA相关的ceRNA网络已经算是比较老的研究套路了.那如果在lncRNA这个老树上找到新的方向呢?今天就介绍一个可以预测lncRNA可变剪切的数据库 ...

  • 他们只想做自己

    前两天,我回了趟老家.自从新冠肺炎疫情发生,我半年多没回家.推开家门,就撞见正要出门办事的我爸:他穿了一件洗得掉色的上衣,裤子膝盖处烂了个大洞,脚上的鞋也不知道穿了多久,大拇脚指头顶着鞋尖," ...

  • 余生,只想做一个优雅知性的女子

    早上,我指着结婚照片,笑着取笑老公:"看你以前多瘦啊,现在胖的跟以前都不像一个人了!哈哈哈-"老公回我:"还说我呢?你自己也跟以前不一样了!难道你没发现吗?"一 ...

  • 面对女神,难道你真的只想做一个好人?

    Hello,大家好,我是情圣老司机. 不想做男性朋友,只想做你的男朋友. 相信很多同学都遇到过这样的情况,和心爱的女生暧昧地聊着,互动的还不错,可是一旦往前进步一点点,女生就会突然告诉你: 我一直把你 ...

  • 宋词一姐李清照:再婚、坐牢、手撕渣男,只想做自己的太阳

    左手指月(古琴版) 白无瑕;古琴唐彬 - 左手指月 "我要举报,我的第二任丈夫张汝舟谎报科考举次,欺君罔上!" "你可想好了?依大宋律令,凡状告亲人者,即便经查属实,你也 ...

  • 盛原:称呼都是别人给的,我只想做自己 | 人物

    文 | 张硕 如果没有爸爸的教导和坚持,盛原或许就和此生挚爱的钢琴擦肩而过了:如果没有体校的意外落榜,盛原或许已经凭借出色的弧线球射门成为了一名专业的足球运动员.好在,因为这一点机缘.一份热爱,一切的 ...

  • 我不是药神,我只想做个好人

    近日,看了一部很火的电影,名字叫<我不是药神>.今天,谈一谈这部电影. 在谈<我不是药神>之前,我先来谈谈徐峥. 喜欢徐峥,也喜欢小陶红,这夫妻俩,在演艺圈里,没有丑闻,也没有 ...

  • 拒签TVB惨被列黑名单!31岁上位小生跳槽友台拍剧:我只想做演员

    本文由 TVB剧透君 作者 JacksonTsang 原创  转载请注明:严厉打击任何抄袭行为,势必全网投诉到底! 现年31岁前TVB艺人徐肇平,日前现身大角咀为自己有份参演的Viu TV剧集< ...

  • 发生关系后,男人却说只想做普通朋友,多半是这两个心理

    金星说:"爱情,是你想要什么样的人,婚姻,是你需要什么样的人." 在如今这样的爱情快餐时代,那些真挚的爱情又能有多少呢? 每个人都在期待美好的爱情,但实际上能够收获幸福的人并不多, ...

  • 【白牡丹*精品】我只想做你今生情路上唯一的悟空 . 主播黄金满地.

    诗海追梦文学第1294期 我只想做你今生情路上唯一的悟空 作者. 白牡丹 .主播:黄金满地.主编:玫瑰 点击上方音频 有时候想把你拥在怀中 亲吻你清纯的眉峰 愿意看着你笑 来表达我的情有独钟 有时候想 ...