只聚焦一个基因如何进行下一步研究?

之前有小伙伴提问说,老板只给了一个基因让在胃癌当中研究。组内的测序数据也不让用,想要往下做一些和这个基因有关的基础实验,这个该怎么弄呢?

前段时间给大家介绍了很多很多的数据库,有时候单纯的数据库介绍的话,可能不清楚要怎么使用。所以这次就基于这个问题来来和大家说一下如何来寻找一个基因的一些基本的靶向指标。

寻找直接调控基因

我们要研究一个基因的功能的时候,最常见的就是来做一个这个基因的一个过表达细胞系/敲减(现在可能敲除更流行一些)细胞系,然后和正常表达的细胞系进行比较。通过转录组测序/基因芯片的方式来寻找进行差异基因,这些差异的基因就是收到目标基因影响的基因了。那👆也说了,我啥都没有,只有一个基因名。那肯定是手头没有这种数据的,但是自己手头没有不代表别人没有的。

我们在之前介绍GEO数据库的时候说过,这个数据库储存了很多其他人发表的高通量检测的数据,而这个数据当中也包括一些在发表基础实验文章的时候,自己做的目标基因过表达/敲减后的数据。所以说,可以试着去搜搜看,万一你研究的基因,就有人做过敲减的数据。那我们拿来进行一下分析不就可以直接用了嘛。例如 GSE27870这个基因集,里面就包括了很多基因Knock Down的芯片数据。至于如何进行差异表达分析的话,可以用GEO2R的嘛。这个我们也介绍过的,具体操作可以看这个帖子GEO2R差异表达分析软件

同样的如果我们之前介绍的KnockTF数据库,也是拿敲除的转录因子和没有敲除的进行比较分析获得的结果。所以如果研究的是一个转录因子拿仍然可以在KnockTF数据库试一下有没有结果的: KnockTF:转录因子敲除数据库(一)KnockTF:转录因子敲除数据库(二)

寻找间接作用基因

如果说,我们在GEO数据库里面检索了,没有发现和我这个基因相关的过表达/敲减的数据集,那怎么办呢?这个时候就可以通过全基因组的方法来寻找相互作用的基因。高通量测序的好处,在于我们可以一次性获得很多基因在相同样本的表达量。如果说这两个基因存在相互作用关系,那这两个基因的表达趋势就很有可能是一致的,所以通过相互相关分析就可以获得两者基因的相关系数,就能明白目标基因和哪些基因存在相互作用关系了。

由于这个小伙伴研究的是胃癌。癌症就很好说了,可以使用我们昨天推荐的cbioportal数据库来进行基因的共表达分析。为什么不用GEPIA呢,因为GEPIA只能进行制定基因的检索的。

对于共表达结果的筛选的话,记得不能单纯用p或者q值来筛选,对于相关分析而言p值并不能说明这两者的相关很大,所以我们要通过相关系数来进行筛选,筛选的时候记得结合这两个来进行筛选。

另外由于相关分析只能确定两者存在相互作用关系,但是并不能确定说谁是谁的上游。所以说这个结果肯定没有直接检索到过表达的结果好,但是也是一种来进行寻找作用基因的方式。

目标基因的精简

不过是通过过表达的数据还是全基因组的数据,我们到最后其实会得到很多相关的基因,这个时候要怎么精简了呢?这个时候就需要给予自己的实验目的来了,如果说我们寻找的是lncRNA这种的。那就可以对相互作用的基因进行注释,看哪个基因是lncRNA即可。基因注释的话,推荐可以使用biomart的网页版。这个不需要代码操作。改天可以写一篇相关的帖子介绍一下。

如果没有一个很好的想法的话,那可以先对相互作用目标基因进行富集,看看有没有自己想要的某一个研究方向。如果有的话,在富集结果里面挑选即可。富集的好就可以使用WebSestalt富集分析软件

TCGAG多组学联合分析数据库2020-05-17
多组学文献精读05 | TCGA中的致癌信号通路(视频)2020-05-16
数据库使用的隐藏技巧2020-05-15
[数据库介绍]一站式表达谱数据分析2020-05-14

合作或转载请后台联系~

(0)

相关推荐

  • Starbase:研究RNA,有人不知道它吗

    Starbase数据库于2011年上线,目前更新到3.0版本,开发者是中山大学RNA信息中心的屈良鹄研究团队.Starbase是做lncRNA/circRNA/microRNA等研究常用的强大数据库, ...

  • 发表在nature protocol上的相互作用数据库是什么样子的(二)

    昨天我们介绍了ConsensusPathDB的基本功能以及其在蛋白相互作用查找当中的使用.今天我们继续把ConsensusPathDB剩下的功能来进行介绍.2. 基因富集分析2.1 数据库输入对于这类 ...

  • 哈?确定这是我零代码能复现的非肿瘤文章吗!

    解螺旋公众号·陪伴你科研的第2541天 零代码复现非肿瘤文章 大家好,我是濤濤.众所周知,仙桃生信工具www.xiantao.love一直致力于协助大家在进行生信研究提供便利性.最近,仙桃生信工具又推 ...

  • GO分析和KEGG分析都是啥?

    前几天和大家介绍了一下GEO数据库以及使用GEO2R进行差异表达分析GEO2R差异表达分析软件.几乎现在的套路性文章在做完差异表达分析后,都会去做GO和KEGG富集分析.那么GO和KEGG都是什么?富 ...

  • 公共数据库基础生信分析汇总贴

    通过差不多十天左右的推送,我们基本上把生信分析最最基本的套路从头到尾讲了一下.这里就把之前的帖子总结一下(顺便水一篇 ),算是一个总结帖吧!基本的分析思路就是下面的一个流程: 对于这种分析套路我们写了 ...

  • GEO数据纯生信准3分SCI思路

    研究背景: 卵巢癌在全球与妇科癌症相关的死亡中排名第五.到目前为止,尚未完全了解卵巢癌的肿瘤发生和预后的分子机制.这项研究旨在发现参与卵巢癌的hub基因和治疗药物. 研究方法: 从Gene Expre ...

  • 托国家队的福!又结识了一个全能的“王者级”lncRNA数据库!

    解螺旋公众号·陪伴你科研的第2415天 lncRNA数据库中的多面手 由于今天这款lncRNA数据库实在是重磅,我就直接告诉大家吧,不管你是做基础研究还是做疾病研究,不管你是研究肿瘤还是非肿瘤,不管你 ...

  • 候选基因那么多,如果选择核心基因?

    在进行高通量测序的时候,我们在会得到很多的候选基因.但是对于基础实验而言,我们往往只需要寻找到这些基因当中重要的那些基因来进行后续的实验即可.但是这么多基因该怎么寻找的呢? 这个一般可以通过通路富集或 ...

  • lncRNA功能预测

    我们在基因研究的时候,需要提前预测这个基因的功能是什么.编码基因可以通过其基因的蛋白结构来预测到主要功能是什么.但是对于长链非编码RNA(lncRNA)的功能,由于其不编码蛋白.这样功能预测的就不适用 ...

  • 非肿瘤(口腔科)也做数据挖掘啦

    一提到数据挖掘,可能大家都会想到肿瘤数据挖掘,而是忽略非肿瘤的方向.今天,我们就给大家介绍一下非肿瘤方向的数据挖掘.作者是日本人,研究是的慢性牙周炎,也就是口腔科,文章发表在BMC Oral Heal ...

  • 一篇最基本生信分析文献解读

    利用一周多的时间,我们把最最基本的生信套路来讲解了一遍.正好前几天一个小伙伴拿了一篇相关文献在咨询问题.这里就拿这篇文献来总结一下我们目前写的这些东西. 这次我们来讲解的这边文献是2019-10-12 ...

  • miRNA‑mRNA调控网络发文思路

    参考文章题目:Identification of biomarkers and construction of a microRNA‑mRNA regulatory network for clear ...