小站工具|求解课题万能公式“A基因通过B通路调控C疾病的D功能”
工具入口:www.chrislifescience.club:3838/R/AnnoE2
为何要求解“A基因通过B通路调控C疾病的D功能”这个公式?
1、这个是一个课题的万能公式,绝大部分课题都可以分解至少一个或多个这样的公式。
2、公式中的ABCD体现了一个课题的创新性,也就是文章的亮点。
3、依靠这样的公式,我们可以很轻松的提出国家自然科学基金的科学假说,也能屡清楚课题中的关键点。
小站工具三大模块介绍
1、差异基因火山图
这个模块主要实现某肿瘤差异基因的筛选。
小站工具这里的数据来源是TCGA的level 3数据,分析流程按照Read Counts to DESeq2分析,对照是Tumor VS Normal。要说明的是Normal是TCGA项目中的对照,而不是用GTEx做为对照。
2、基因表达相关生存期图&ROC曲线
这个模块主要实现某个基因与某肿瘤总体生存期的关系。数据来源同样是TCGA,根据基因的表达量做单因素Cox分析,另外还选择了1年,3年和5年的时间点做了ROC曲线以及AUC计算。
3、基于GSVA分析的基因功能预测
这个模块主要实现了对某一个基因功能预测,并采用火山图的形式进行可视化。当确定研究某个基因的时候,可以用这个模块去预测基因与通路的相关性,与生物学功能的相关性。
这里的基因集涵盖了所有GSEA中的基因集,通过分析样本中基因表达量与基因集指数的关系,能够推测出该基因在某条通路或者与某个具体基因作用机制的关系。这里的数据同样是使用TCGA基因表达谱数据,利用GSVA分析工具,得到样本中基因集指数。
如何求解“A基因通过B通路调控C疾病的D功能”这个公式?
1、公式中的C很容易确定,这里是肿瘤数据,所以根据自己的领域选择一个肿瘤(由于站长服务器资源有限,现仅开放甲状腺癌,肝癌,肺腺癌,肺鳞癌与乳腺癌的数据)。
2、对于A基因的选择是很重要的,如果你是从头开一个课题,建议结合第一和第二模块的数据一起选择。一个基因机制再复杂也需要有临床上的意义作为支撑,所以不要单纯看表达量高低,还要结合临床生存期的数据。
3、对于B和D,可以在GSVA中进行预测,这里需要输入基因的ID也就是ENSG开头的,然后自己去选择通路就可以了。
通过这样三个步骤,我们就解答了ABCD的问题。
总结
1、站长是做湿实验出身。5年前为了找一个基因下游通路,做了n个96孔板的qPCR又得不到一个稳定的结论,那时候真的很绝望,内心极度崩溃。好不容易筛到了,花了大价钱买了n个抗体去做WB,那个过程简直怀疑人生,好在挺了过来,并找了一个十分好的理由来安慰自己,WB的实验台不在西边。而现在,这样的令人崩溃的场面可以最大可能性的避免。
2、站长已经用这套系统选择了6个基因去做实验验证,其中5个基因是可以被验证的,不想去夸大这个方案的可行性,以后还需要更多的验证,但站长相信他可以帮助做实验的人少走弯路。
3、筛选的第一步是最关键的,如果自己是懂得R语言,数据下载以后是可以用简单的merge实现交叉筛选的。这样一个功能开发不难,站长自己的Pro版App有个Idea模块就是这样的,此部分暂时不开放,有需求私聊吧。
One More Thing......
1、国自然刚刚结束,估计8月中旬就要发榜,那个时候绝大部分人又该准备新一年的申报了。A基因通过B通路调控C疾病的D功能,是国自然的惯用模式,既然解出了ABCD,当然可以把公式转化成国自然的课题或者研究室开题的内容。会在今后的内容,更新如何转化的过程。
2、前几天远程围观了国内生信大神们在珠海的聚会。还是有些感触的,只会按回车跑流程是会被很快淘汰。生信是数学、计算机科学与生命科学交叉而成,交叉才是核心竞争力,能交叉的点越多,被淘汰的概率越小,当然也会更难。站在跨越工业革命时代节点上,竞争是残酷的,但我们是幸运的,互联网让知识的获取变得是那么的容易,所以一起学习,进步吧!