R语言GEO数据处理(四)

# 3. id转换 -----------------------------------------------------------------

##方法一:使用R包转换

index = gset[[1]]@annotation

if(!require("hgu133a.db"))

BiocManager::install("hgu133a.db")

library(hgu133a.db)

ls("package:hgu133a.db")

ids <- toTable(hgu133aSYMBOL)

head(ids)

length(unique(ids$symbol))

table(sort(table(ids$symbol)))

###id转换

library(tidyverse)

exp <- as.data.frame(exp)

exp <- exp %>%

mutate(probe_id=rownames(exp)) %>%

inner_join(ids,by="probe_id") %>%

select(probe_id, symbol, everything())

exp2 <- exp[!duplicated(exp$symbol),]

rownames(exp2) <- exp2$symbol

exp2 <- exp[,-(1:2)]

exp2[1:3,1:3]

##方法二:使用soft文件注释

##方法三:手工注释

(0)

相关推荐

  • Probe id 如何转换为gene symbol?

    之前有很多人问我们,有时候没有DataSet full SOFT file文件,只有图二的界面,该怎么办呢? 我们可以下载Series Matrix File(s),然后进行分析 但是这样得到的仅有p ...

  • R语言GEO数据处理(一)

    # 1. GEO数据下载 ----------------------------------------------------------------- rm(list=ls())   #清空环境 ...

  • R语言GEO数据处理(二)

    #1. GEO数据的下载 ##1.1 方法一:下载RAW Data数据 ##1.2 方法二:下载series Matrix表达数据 rt <- read.table("GSE56814 ...

  • R语言GEO数据处理(三)

    # 2. 提取表达和临床信息 --------------------------------------------------------------- ##2.1 通过pData函数获取分组信息 ...

  • R语言GEO数据处理(五)

    # 4. PCA分析 ---------------------------------------------------------------- library(FactoMineR) libr ...

  • R语言GEO数据处理(六)

    # 5. 差异分析 ----------------------------------------------------------------- library(limma) design=mo ...

  • R语言GEO数据处理(七)

    # 6. 可视化展示 ---------------------------------------------------------------- ##6.1 火山图 library(ggplot ...

  • 各类统计方法R语言实现(四)

    白介素2的读书笔记,分享临床科研干货,一起见证时间的力量 不知不觉就到第四期了,小伙伴们是否跟着我们的推文一起练习了呢?当然,统计光靠跑代码是不够的,还需要结合理论知识一同学习,可以边复习理论,边跟着 ...

  • R语言GEO数据挖掘-功能富集分析

    欢迎来到医科研,这里是白介素2的读书笔记,跟我一起聊临床与科研的故事, 生物医学数据挖掘,R语言,TCGA.GEO数据挖掘. 功能富集分析   在得到了差异基因的基础之上,进一步进行功能富集分析,这里 ...

  • R语言GEO数据挖掘01-数据下载及提取表达矩阵

    欢迎来到医科研,这里是白介素2的读书笔记,跟我一起聊临床与科研的故事, 生物医学数据挖掘,R语言,TCGA.GEO数据挖掘. 这一节的内容包括应用 GEOquery包下载芯片数据,提取表达矩阵,提取m ...