ENGS-SYMBLE的ID转换代码

##read.delim()函数读取tsv数据

stringsAsFactors=FALSE

exp <- read.csv("ID.csv",header = TRUE, sep = ",")

data=data.frame(exp)

library(stringi)##加载包

data$Ensembl_ID=stri_sub(data$Ensembl_ID,1,23)##保留前15位

# 加载相关包

library(clusterProfiler)

library(org.Hs.eg.db)

# 查看org.Hs.eg.db 包提供的转换类型

keytypes(org.Hs.eg.db)

# 需要转换的Ensembl_ID

Ensembl_ID <- data$Ensembl_ID

# 采用bitr()函数进行转换

gene_symbol <- bitr(Ensembl_ID, fromType="ENSEMBL", toType=c("SYMBOL", "ENTREZID"), OrgDb="org.Hs.eg.db")

# 查看转换的结果

head(gene_symbol)

(0)

相关推荐

  • 生信基础 | 人-小鼠基因之间的比较

    先看看MSigDB中的基因ENTREZID是否可以全部转化为SYMBOL. library(biomaRt)library(clusterProfiler)library(org.Hs.eg.db)l ...

  • R语言的繁荣背后何尝没有隐患

    R语言的繁荣是毋庸置疑的,至少在科研界的地位蒸蒸日上,极大的占领了原来属于各种商业绘图软件的市场.不仅仅是在于其免费的属性,更重要的是随心所欲地自由定制. 但是参与的玩家多了之后,也会出现一些冲突.最 ...

  • 从ensembl的ID到其转录本坐标

    假设通过了某种分析(差异分析,peaks富集等等)得到了指定的基因集,但是是以ensembl数据库ID命名的,比如: [1] "ENSMUSG00000000031" " ...

  • ID转换靠的是深厚的背景知识加上一点代码技巧

    有学员提问: 请教老师,在分析一个芯片数据时候,遇到这个GPL16686平台,直接看平台信息里面的表格如图,找不到基因名,所以不知道该怎么办,ID转换就卡死了,后续的差异分析,火山图,热图等等都无从下 ...

  • 让你的基因有名字

    分享一下学员笔记,主要是她跟了我们<数据挖掘>课程后,在进行GO富集分析可视化遇到的问题:展示通路的共同基因绘图时无法显示基因名,只显示ID号码 第一次绘图 下面展示代码: library ...

  • 学徒笔记——芯片数据的注释文件获取

    目前芯片数据的分析流程都可以通过AnnoProbe包简单的完成上游分析,包括表达矩阵获取.分组方案的构建和数据注释,但是也存在一些平台的数据无法被该包直接获取.AnnoProbe获取注释信息的方式是通 ...

  • 这个芯片仅提供了GenBank的索引号

    粉丝来信求助,他感兴趣的一个数据集的芯片平台是:GE Healthcare/Amersham Biosciences CodeLink Human Whole Genome Bioarray,链接是: ...

  • 一个基因有两个id我能肿么办

    有学员提问, 为什么他看到了一个基因,如下所示,居然有两个id,看起来就非常的诡异,让他百思不得其解. 一个基因有两个id 其实这个基因首先是有一个基因名字,是 MATR3 ,是人类基因命名委员会给出 ...

  • 基因ID转换工具比较

    写在前面 昨天我们介绍了三个ID转换的工具: DAVID.g:Convert 以及 biomart,但是这个工具内置的数据怎么样并不清楚,所以今天就来评价一下这几个工具吧. 数据准备 由于我们使用最多 ...

  • 酷我音乐网ID转换MP3网址(歌词)

    <KUWO音乐网ID转换MP3网址(歌词)>能将酷我音乐网的音乐ID转换为可供外链的MP3网址,如该歌曲配有动态歌词,就会转换为LRC歌词.如果转换成功立即播放.显示同步歌词,并可复制转换 ...

  • ID转换大全

    实际上掌握了编程的思维,任何一门语言都可以做id转换! 对于初学者来说,这个是非常实用的一个,很多人当初就是因为要做这个转换,才慢慢走入了编程的道路. 使用大部分软件的时候,第一步就是文件数据准备,基 ...

  • GPL17586、GPL19251和GPL16686平台芯片ID转换

    芯片分析中经常会遇到Affymetrix Human Transcriptome Array 2.0芯片,由于目前还没有现成的R包可以用,因此分析方法也不统一.见生信技能树Jimmy老师HTA2.0芯 ...

  • 生信编程8.ID转换

    有一些五六年前的学生们都成长为了各个生物信息学相关公司的小领导,而且他们都有了自己的公众号,知乎号,也算是一番人物.最近他们跟我反馈面试找不到或者说很难直接考核筛选到认真干活的生信工程师,挺有意思的. ...

  • 你的ID转换错啦

    最近学员群又有人问到了 Agilent-012391 Whole Human Genome Oligo Microarray G4112A 这样的芯片数据,我让学生打包数据成为rdata发给我,我检查 ...

  • 你只想做ID转换却不知道为什么要转换

    最近咱们<生信技能树>的VIP答疑群,有这样的提问:   我觉得很有代表性,很多人仅仅是学了个皮毛,知道是需要进行ID转换,也能够运行代码.但是却搞不懂,不理解自己为什么进行ID转换,以及 ...

  • TCGA转录组差异分析后多种基因功能富集分析:从GO/KEGG到GSEA和GSVA/ssGSEA(含基因ID转换)

    TCGA转录组数据在完成差异分析后,我们通常希望系统地获取这些成百上千的差异基因的功能信息,帮助我们分析下游实验的思路.面对大量的差异基因,逐个查询基因功能是不切实际的.所以我们需要借助基因功能富集分 ...