学徒数据挖掘专题半年目录汇总(生信菜鸟团周一见)
不知不觉学徒培养的第二个年头已然过去一半,好的学习习惯、方法以及名师的指导对个人的成长帮助是毋容置疑的。
我比较喜欢把自己认为重要的知识点布置给学徒,让他们从头到尾的写出来,成为推文教程笔记分享。
这半年累积了不少优秀作业,其中有一个专栏在生信菜鸟团持续周一发布,非常受大家欢迎,虽然说微信公众号的时效性很差,但即使是这样的碎片化时间也值得大家拿出来一起学习,亲测可以直接使用的数据挖掘代码和数据分析思路,以及可视化函数。
数据挖掘专题目录
本来是希望有粉丝主动帮忙整理成为目录后邮件发给我领取惊喜,不过,很可惜大家都不够主动,所以还是“安排”了学徒来制作下面的目录,首先感谢一下她不辞劳苦整理,也希望这些教程能帮助到你!
数据挖掘系统性教程
首先必须是走标准分析流程,火山图,热图,GO/KEGG数据库注释等等。这些流程的视频教程都在B站和GitHub了,目录如下:
第一讲:GEO,表达芯片与R
第二讲:从GEO下载数据得到表达量矩阵
第三讲:对表达量矩阵用GSEA软件做分析
第四讲:根据分组信息做差异分析
第五讲:对差异基因结果做GO/KEGG超几何分布检验富集分析
第六讲:指定基因分组boxplot指定基因list画热图
第七讲:根据差异基因list获取string数据库的PPI网络数据
第八讲:PPI网络数据用R或者cytoscape画网络图
第九讲:网络图的子网络获取
第十讲:hug genes如何找
还可以细读表达芯片的公共数据库挖掘系列推文 ;
如果你的时间精力有限,自学困难
并不是每个人都可以抽出时间慢慢摸索代码,或许你恰好需要一个线下环境来督促和提供学习交流氛围,而你恰好在广州附近,你可以选择我们在广州珠江新城滚动开班的GEO数据挖掘,详情见:广州珠江新城GEO数据挖掘滚动开班
最后友情宣传生信技能树
本来是夸奖表扬帮我制作目录的这个学徒,但是最后却不得不批评一下,把这样的目录放在公众号推文居然出现了非法链接,我至少浪费了7分钟来排查问题出在哪里,大家不要小瞧这个七分钟,连我都需要七分钟来排查错误,说明普通人至少需要7个小时的工作量才可能找到这个目录问题出现在哪里!
如果你不相信的话,可以试试看是不是你需要七个小时才能做到我只需要七分钟完成的debug工作量。
肉眼是完全看不出来的bug!!!