招贤纳士-学徒数据挖掘代码检查员
公共数据库挖掘这个技能的重要性大家认识不够,能极大程度的避免大家重复浪费科研经费去做一些明明可以通过分析公共数据库拿到的结论!
比如你研究的癌症里面哪些基因高表达,哪些低表达,你通过数据挖掘拿到了感兴趣基因,后续自己设计基础实验来探索它们,完善你的生物学故事。假如你并不知道可以分析公共数据库,那么你就不得不自己去做一次癌症病人队列的转录组,耗费几万块钱来拿到一个本来就可以通过公共数据库分析拿到的上下调基因。或者说,你已经有了比较完整的生物学故事,定位到了具体的通路或者基因,如果想设计病人队列来说明你感兴趣的基因或者通路的临床意义,就是一个大工程,从病人招募信息整理,到ngs组学数据采集,分析,统计可视化等等。但是大概率上你感兴趣的疾病都会有现成的公共数据,你完全可以选择从你感兴趣的角度来对它进行分析!
所以我安排比较有空的学徒做了一系列的文献图表复现,也断断续续坚持了两年。但是这两年有些知识点过时了,而且可能推文教程里面有一些不恰当的地方,甚至错误的地方,急需一些人手来复现这些教程并且进行一定程度的矫正!
第一期(2018年秋季)
保姆式GEO数据挖掘演示--重现9分文章 GEO数据挖掘-第一期-胶质母细胞瘤(GBM) GEO数据挖掘-第二期-三阴性乳腺癌(TNBC) GEO数据挖掘-第三期-口腔鳞状细胞癌(OSCC),WGCNA GEO数据挖掘-第四期-肝细胞癌(HCC),WGCNA GEO数据挖掘-第五期-肝细胞癌(HCC)-多组分开差异分析 GEO数据挖掘-第六期-RNA-seq数据也照挖不误 TCGA数据库的TP53突变型和TP53野生型BRCA病人的差异分析结果 GEO数据库的耐药与敏感的患者组织内的成纤维细胞比较 TCGA数据库中三阴性乳腺癌在亚洲人群中的差异表达 TCGA数据库的有PIK3CA基因突变的肿瘤病人的转录水平变化 TCGA数据库里面的乳腺癌的芯片表达数据进行差异分析
第二期(2019年全年)
1. 公共数据辅助乳腺癌的免疫治疗机制研究 2. 有生物学意义的复杂热图 3. 干扰MYC‑WWP1通路重新激活PTEN的抑癌活性——3步搞定GSEA分 析 4. 按基因在染色体上的顺序画差异甲基化热图 5. 热图、⻙恩图、GO富集分析图(有了转录组数据不知道该怎么写⽂ 章,看我就对了!) 6. 纯R代码实现ssGSEA算法评估肿瘤免疫浸润程度 7. 肿瘤异质性+免疫浸润细胞数据挖掘(可能是最简单的3分⽂章了) 8. ArrayExpress数据库的基因芯⽚原始数据处理,3D主成分图及聚类热 图 9. 学徒数据挖掘第⼆期汇总之多分组基因注释代码⼤放送 10. TCGA数据辅助甲基化区域的功能研究 11. 你确定你的差异基因找对了吗? 12. 看nature⽂章是如何设计和使⽤普通转录组数据 13. 不⼀定正确的多分组差异分析结果热图展现 14. 如果传统bulk转录组数据队列⾜够⼤也可以使⽤单细胞流程 15. 最简单的芯⽚挖掘也会出错(菜⻦团周⼀数据挖掘专栏第?期) 16. 乳腺癌的IHC分类和PAM50分型的差异情况
招贤纳士
整理这些数据挖掘教程还是需要有一定R语言和数据挖掘知识底蕴的,所以大家量力而行哦。

应聘需要发简历以及自己的科研项目经验到我邮箱(jmzeng1314@163.com)。理论上我每封邮件邮件都会回复,所以大胆的发简历给我吧,合适的应聘者我会详细沟通电话面试安排。
赞 (0)