优秀本科生毕业设计辅导第二期

转眼间距离去年的本科生毕业设计活动过去已经一年了,新的一批求助者又出来了,是时候重启它了!

可以先回顾一下去年(2020-03-13)的活动链接:这120万我就不要了,送给500名优秀本科生,主要是考虑到有大量非生物信息学专业的大三大四在读本科生马上面临毕业设计这个人生难题,而足够优秀并且有毅力的小伙伴是值得我们指引,加速他们的科研生涯!

如何定义优秀本科生

如果我说双一流,985,211之外的高校可以排除掉肯定会被骂死,所以我不能这样做。还是不看出身吧,只需要你的绩点排名是班级top 20% ,就可以定义为优秀哈。不过,如果是双一流,985,211高校可以放宽到30%~40%哈。如果是其它高校,绩点无法达到要求,也可以提交在校期间的奖励获取情况来说明自己的能力哦。

为什么只能是优秀本科生

其实很简单,如果你不够优秀,数据分析这条路你也很难走通的,代码和数据图表给到你,你的理解能力我也担心你hold不住额。

另外,虽然我不收费,但是免费的其实是一种战略投资,你们拿到了我的知识资助,开心的毕业了。找到了好工作,如果足够努力和热爱,说不定会成为一个生信工程师。至少生物背景的你,只要还没有转行,是非常有希望十多年后入职我的公司。而且你会成为我们生信技能树的口碑,就算你不入职,可能你学校的师弟师妹会在你的传播下,对生信技能树有好感!你应该理解,没有人会投资一个不值得投资的不优秀本科生吧!

为什么我不收费

其实120万确实没有啥用,小学时候在农村,每天零花钱是一毛钱,还需要扫地换取。初中到了镇上,一个星期有15块钱,基本上吃完饭也就买包辣条。高中到县城了,一个月可能有300吧,从来没有买过教辅类的书籍的我甚至都想不起来钱花在哪里了?

一晃我高中毕业都十年了,这些年北上广深都生活过,反正大学刚毕业那会没什么见识,就觉得北上广深房价简直是不可思议,怎么可能有人花两三百万买房?没想到现在如果是在我户口所在地(深圳南山区高新南四道)买房需要花的是两千多万,有了见识的我仍然是选择放弃!

这120万还不够我凑个首付,哪怕是开发商做活动搞一下一成首付!但是如果我帮助了你,你的人生顺畅了至少比现在被困在本科阶段要多产出几万块钱的收益吧,相当于我放弃120万,能帮助500人多挣一两千多万,是一个放大效应。我非常开心!

我提供什么

我首先查询了一下本科生毕业设计的意义:
  • 高等学校学生的毕业设计(论文)是实现本科培养目标的重要教学环节,一般安排在大学期间的最后学习阶段。在此阶段,学生将进一步受到科学研究方法、工程设计方法与实践技能的基本训练,并对大学期间所学知识进行全面总结与综合运用,培养学生分析问题和解决问题的能力,从而实现实践能力、科学研究能力、创新能力与综合素质的全面提升。
对生物学方向本科生来说就是你需要完成一件事并且写出来去答辩,比如实验探索一个基因的功能,或者数据分析一个基因的功能。我这边为了简易批量帮助足够多的人, 就拿我最擅长的差异分析吧,就针对GEO和TCGA数据库挖掘来给大家模板代码来套用到任意癌症,任意亚型,任意分子,任意临床分组

你可以看乳腺癌或者肝癌,胃癌,肾癌,卵巢癌等等TCGA数据库癌症种类列表里面有的,你都可以选择。

如果是乳腺癌,你可以看lumA,lumB,basal,HER2 等亚型,如果是胃癌,也是有4种分子分型,具体如下:
  • ①爱泼斯坦-巴尔(Epstein-Barr)病毒(EBV)阳性型肿瘤:约占胃癌的9%,表现为较高频率的PIK3CA基因突变和DNA极度超甲基化,以及JAK2、CD274(也称PD-L1)和PDCD1LG2(也称PD-L2)基因扩增。
  • 微卫星不稳定(MSI)型:约占22%,表现为重复DNA序列突变增加,包括编码靶向致癌信号蛋白的基因突变。
  • 基因稳定(GS)型:约占20%,其组织学变异弥漫且丰富,RHOA基因突变或RHO家族GTP酶活化蛋白基因融合现象多见。
  • 染色体不稳定(CIN)型:此类肿瘤占胃癌的比例近一半,表现为显著异倍体性及受体酪氨酸激酶的局部扩增。
可以看mRNA表达矩阵,区分成为编码基因和非编码的,可以看miRNA的,可以看甲基化水平。

所以课题至少有20种癌症,除以 4种亚型,除以4种分子,除以4种临床分组。至少1280个项目了,起码咱们群里的小伙伴可以人手一个课题啦。

我的代码就是为本科生毕业论文准备的哈,所以医学生们就不要看了,据我所知,医学生是没有毕业论文的。然后研究生们也不要看了,都是很简单的标准分析流程,火山图,热图,GO/KEGG数据库注释等等。这些流程的视频教程都在B站和GitHub了,目录如下:

  • 第一讲:GEO,表达芯片与R

  • 第二讲:从GEO下载数据得到表达量矩阵

  • 第三讲:对表达量矩阵用GSEA软件做分析

  • 第四讲:根据分组信息做差异分析

  • 第五讲:对差异基因结果做GO/KEGG超几何分布检验富集分析

  • 第六讲:指定基因分组boxplot指定基因list画热图

仅仅是最后得到的差异分子,并不是以前的mRNA后面的基因名,而是miRNA,lncRNA,甚至circRNA的ID,看起来很陌生罢了。感兴趣可以细读表达芯片的公共数据库挖掘系列推文 ;

再次强调,仅仅是提供本科生毕业设计指导,提供代码和数据,你自己任选一个组合成为一个课题,你需要广泛阅读相关癌症背景知识,表达矩阵分析背景知识,从有可能写成自己的本科毕业设计论文。

另外,强调一下,我不为你服务,也不给你写论文,也不收费!

如何参与

看清楚前面的定义,符合优秀本科生要求的再联系我哈!除非你能说服我你不符合条件但是也非常有毅力学习。

大四毕业生优先,大三大二也可以,必须是生物学相关专业哦,其它专业我也指导不了。

研究生请不要联系,我这里不是提供服务的,只有公开课,而且你有自己的导师!而且真的只是一个很简单的本科生毕业设计水平的指导而已!

(0)

相关推荐