什么?1.3万基因都是你的靶基因?

一般来说,我们进行数据库注释,基因数量在20到500之间,其实100个左右是比较理想的!比如使用Y叔的clusterProfiler进行gsea分析,就有  minGSSize    = 10, 和  maxGSSize    = 200, 的设置,全部代码如下所示:

rm(list = ls()) 
options(stringsAsFactors = F)
lapply(c('clusterProfiler','enrichplot','patchwork'), 
       function(x) {library(x, character.only = T)})
# Please go to https://yulab-smu.github.io/clusterProfiler-book/ for the full vignette.
data(geneList, package="DOSE")  
#4312     8318    10874    55143    55388      991 
#4.572613 4.514594 4.418218 4.144075 3.876258 3.677857
class(geneList)
#[1] "numeric" 
kk2 <- gseKEGG(geneList     = geneList,
               organism     = 'hsa',
               nPerm        = 10000,
               minGSSize    = 10,
               maxGSSize    = 200,
               pvalueCutoff = 0.05,
               pAdjustMethod = "none" )

  • gseKEGG输入形式:将基因按照logFC进行从高到低排序,只需要基因列和logFC
  • organism:物种,http://www.genome.jp/kegg/catalog/org_list.html
  • nPerm:permutation numbers
  • minGSSize:通路最小基因数
  • maxGSSize:通路最大基因数
  • pvalueCutoff:最小p值
  • pAdjustMethod:p值校正方法,"BH"

一般可通过改变minGSSize,maxGSSize数目调整通路大小,但是默认设置肯定是有自己的道理。

但是最近有粉丝在交流群里提问, 他做一个基因CREB1的靶基因调控网络,但是节点太多了,导入cytoscape就奔溃,希望有一个解决方案。我简单看了看,他使用的数据库:Harmonizome ,可以依据ENCODE的ChIP-seq数据结果来查询对应的基因的靶基因:

  • https://maayanlab.cloud/Harmonizome/gene_set/CREB1/ENCODE+Transcription+Factor+Targets

确实啊!13251 target genes of the CREB1 transcription factor in ChIP-seq datasets from the ENCODE Transcription Factor Targets dataset.

也就是说,非常的震惊,1.3万基因都是CREB1 的靶基因!

1.3万基因都是CREB1 的靶基因

另外,这个基因有一个网页工具数据库,早在2005就发表在了PNAS杂志:Genome-wide analysis of cAMP-response element binding protein occupancy, phosphorylation, and target gene activation in human tissues

数据库链接是:http://natural.salk.edu/CREB/ ,有意思的是,那个时间窗口(2005)是根本就没有ChIP-seq这样的技术来找其靶基因的,还是处于芯片早期发展阶段。

image-20210730083927359

主要是一个ChIP-chip和一个表达量芯片的数据,这个工具就是整合两个数据结果,供读者查询罢了。

那么,问题来了,ChIP的技术看结合,与敲减基因来干扰基因表达获取靶基因哪个好?

欢迎畅所欲言!

如果是干扰基因表达获取靶基因通常是差异分析

简单的差异分析看我六年前的表达芯片的公共数据库挖掘系列推文即可哈 :

如果是ChIP的技术看结合

我们也有免费视频课程《ChIP-seq数据分析》,视频观看方式

  • 首先视频免费共享在B站:https://www.bilibili.com/video/BV16s411T7Fh
  • ChIP-SEQ实战演练的素材:链接:https://share.weiyun.com/53CwQ8B 密码:ju3rrh, 包括一些公司PPT,综述以及文献
  • ChIP-SEQ 实战演练的思维导图:文档链接:https://mubu.com/doc/11taEb9ZYg 密码:wk29

目前,上面的链接都是亲测有效的,如果你看完发现链接无法打开,说明已经里面被举报而封杀了,只能是去交流群拿到最新链接了

文末友情推荐

做教学我们是认真的,如果你对我们的马拉松授课(直播一个月互动教学)有疑问,可以看完我们从2000多个提问互动交流里面精选的200个问答!

与十万人一起学生信,你值得拥有下面的学习班:

(0)

相关推荐

  • 手把手教你用R做GSEA分析

    GSEA是非常常见的富集分析方式,以前我们做GSEA需要用依赖java的GSEA软件,那个时候准备分析的文件可能要花上很长时间,报错还不知道如何处理.现在我们来学习一下R语言进行GSEA分析. 加载R ...

  • 集合多种功能的转录调控数据库

    我们知道基因在表达的过程当中,收到很多因素的调控.其中转录因子对于基因的调控就是其中的一种方式.目前对于转录调控的研究,在高通量测序方面主要还是通过类似chip-seq这类的方式来进行研究.对于转录调 ...

  • 数据库使用的隐藏技巧

    对于网络端的数据库而言,其实很多用法都很简单,我们只需要按照作者给提供的界面,选择合适的输入内容,就可以出来相对应的结果了.本公众号自开通以来也介绍了很多实用的数据库这次呢,就和大家分享一个一个数据库 ...

  • 没有人轻松月入过万,都是熬过来的!心情说说

    月入一千写什么? 月入一万写什么? 没有月收入写什么? 一个人的收入,定位了太多,定位思考,定位自己的衣食住行,很多事,没有收入,就没法维持生活,写作的同时,也要认清自己的路,明白自己的选择,是什么让 ...

  • 史无前例,100万人都去看的展有什么好看的?

    克勒门 一个在上海发现美.创造美.传递美的文化沙龙. 从去年10月28日至今,在上海有一个史无前例火爆的画展,历经2次延期,长期霸占新闻头条. 你们一定猜到了吧,它就是即将于4月15日闭幕的" ...

  • 加拿大妈妈崩溃:老公突然去世,$68万RRSP都留给了婆婆,女儿还没成年!

    丈夫不幸去世,留下她和13岁的女儿.还没从悲恸中走出,另一个打击接踵而至:丈夫多年来存在注册退休储蓄金账户RRSP中的68万加元遗产的受益人,并不是自己-- 相信大家对RRSP都不陌生--这是加拿大政 ...

  • 早年,黄渤曾被记者问:“你年收入8000万,都上了福布斯名人榜,

    为什么还让老父亲一个人住在养老院?"没想到,黄渤听到后一脸认真的说:"我真的无能为力." 黄渤出生在青岛,他的父母都是公务人员,在这样的干部家庭长大,黄渤没有中规中矩的生 ...

  • 「WPS文档高手秘籍」日薪不到208万的都该学学!

    见字如面,我是海宝 不知道这两天大家有没有吃到郑爽的

  • 战国时期打仗动辄几十万人,可为啥到清朝动员几万人都很吃力?

    在古代战争中,交战双方的武器通常不会存在代差,所以兵力就成为取胜的一个重要因素.纵观整个春秋战国时期,中原各国混战动辄就几十万人参战.如果一场战役的兵力不到十万人,这都算不上什么大战. 公元前366年 ...

  • 当年新车30万落地的进口标致308,如今3万块都被人嫌弃?

    哈喽,大家好!检车家老司机又跟大家见面啦.我是一名有着多年维修经验的维修技师,现在专业的二手车检测师,大家都叫我英俊.可能长得太帅,出去别人都觉得我不像修车工,但是我看车还真的有一套!今天给大家带来的 ...

  • 每个月养老金过万的都是什么人?

    最近,有个帮爷爷领工资的帖子流传了出来,上万的退休金让人们艳羡不已! 网友纷纷表示:8万块钱的退休金?这是什么神仙水准!要知道,咱们平常人每个月退休金能上三四千的都是过得非常好的了!什么人能拿到每个月 ...

  • 7个五一在家就能做的健康自测!第6项8000万人都难通过

    尽管面临千夫所指,日本政府坚持「只要不看不听就可以当作事情没发生过」. 流产.致畸.杀精--核废水将怎样影响我们的健康?可能远远超出你「不吃海鲜就可以」的想象. 膝关节自测 ➼测试方法: 双脚与肩同宽 ...