这120万我就不要了,送给500名优秀本科生
这些天连续收到好些大四临近毕业的本科生求助,大意都是:内心非常绝望,而且受新冠病毒疫情的影响,学校现在也没开学,毕业设计实验受阻,估计今年毕业都有点困难。网络搜索了很多,加上师兄师姐也推荐现在转数据分析课题可以快速毕业,而且不受客观条件限制。
基本上在网络搜索生信相关关键词,都是我们生信技能树这6年来分享的教程,但是他纯生物背景不清楚自己一个月能否搞定一个简单的差异分析加上生物学解释。有的呢比较机智,希望直接花钱找我买一个成品数据项目代码及分析结果,开价的中位数约2400元。我实际上并没有收费,还是给了他们想要的代码。
顺便找他们聊了聊,想搞清楚大家付费的动机,部分求助者先是马屁拍了一通,感谢话说了一箩筐,然后反过来劝我正好在这个疫情期间,可以抓住这个风口,成品的代码卖个几百份,一百多万就到手了。(比如2400*500=120万)
有趣,但是我觉得收钱多没意思,再说了还没有进入社会的大四本科生能有啥钱,你出的肉疼,说不定还会在外面黑我。这与我的偶像路线的规划不符合,所以我直接就免费,这120万我就不要了,送给500名优秀本科生!
如何定义优秀本科生
如果我说双一流,985,211之外的高校可以排除掉肯定会被骂死,所以我不能这样做。还是不看出身吧,只需要你的绩点排名是班级top 20% ,就可以定义为优秀哈。不过,如果是双一流,985,211高校可以放宽到30%~40%哈。如果是其它高校,绩点无法达到要求,也可以提交在校期间的奖励获取情况来说明自己的能力哦。
为什么只能是优秀本科生
其实很简单,如果你不够优秀,数据分析这条路你也很难走通的,代码和数据图表给到你,你的理解能力我也担心你hold不住额。
另外,虽然我不收费,但是免费的其实是一种战略投资,你们拿到了我的知识资助,开心的毕业了。找到了好工作,如果足够努力和热爱,说不定会成为一个生信工程师。至少生物背景的你,只要还没有转行,是非常有希望十多年后入职我的公司。而且你会成为我们生信技能树的口碑,就算你不入职,可能你学校的师弟师妹会在你的传播下,对生信技能树有好感!你应该理解,没有人会投资一个不值得投资的不优秀本科生吧!
为什么我不收费
其实120万确实没有啥用,小学时候在农村,每天零花钱是一毛钱,还需要扫地换取。初中到了镇上,一个星期有15块钱,基本上吃完饭也就买包辣条。高中到县城了,一个月可能有300吧,从来没有买过教辅类的书籍的我甚至都想不起来钱花在哪里了?
一晃我高中毕业都十年了,这些年北上广深都生活过,反正大学刚毕业那会没什么见识,就觉得北上广深房价简直是不可思议,怎么可能有人花两三百万买房?没想到现在如果是在我户口所在地(深圳南山区高新南四道)买房需要花的是两千多万,有了见识的我仍然是选择放弃!
这120万还不够我凑个首付,哪怕是开发商做活动搞一下一成首付!但是如果我帮助了你,你的人生顺畅了至少比现在被困在本科阶段要多产出几万块钱的收益吧,相当于我放弃120万,能帮助500人多挣一两千多万,是一个放大效应。我非常开心!
我提供什么
高等学校学生的毕业设计(论文)是实现本科培养目标的重要教学环节,一般安排在大学期间的最后学习阶段。在此阶段,学生将进一步受到科学研究方法、工程设计方法与实践技能的基本训练,并对大学期间所学知识进行全面总结与综合运用,培养学生分析问题和解决问题的能力,从而实现实践能力、科学研究能力、创新能力与综合素质的全面提升。
你可以看乳腺癌或者肝癌,胃癌,肾癌,卵巢癌等等TCGA数据库癌症种类列表里面有的,你都可以选择。
①爱泼斯坦-巴尔(Epstein-Barr)病毒(EBV)阳性型肿瘤:约占胃癌的9%,表现为较高频率的PIK3CA基因突变和DNA极度超甲基化,以及JAK2、CD274(也称PD-L1)和PDCD1LG2(也称PD-L2)基因扩增。 ②微卫星不稳定(MSI)型:约占22%,表现为重复DNA序列突变增加,包括编码靶向致癌信号蛋白的基因突变。 ③基因稳定(GS)型:约占20%,其组织学变异弥漫且丰富,RHOA基因突变或RHO家族GTP酶活化蛋白基因融合现象多见。 ④染色体不稳定(CIN)型:此类肿瘤占胃癌的比例近一半,表现为显著异倍体性及受体酪氨酸激酶的局部扩增。
所以课题至少有20种癌症,除以 4种亚型,除以4种分子,除以4种临床分组。至少1280个项目了。
我的代码就是为本科生毕业论文准备的哈,所以医学生们就不要看了,据我所知,医学生是没有毕业论文的。然后研究生们也不要看了,都是很简单的标准分析流程,火山图,热图,GO/KEGG数据库注释等等。这些流程的视频教程都在B站和GitHub了,目录如下:
第一讲:GEO,表达芯片与R
第二讲:从GEO下载数据得到表达量矩阵
第三讲:对表达量矩阵用GSEA软件做分析
第四讲:根据分组信息做差异分析
第五讲:对差异基因结果做GO/KEGG超几何分布检验富集分析
第六讲:指定基因分组boxplot指定基因list画热图
仅仅是最后得到的差异分子,并不是以前的mRNA后面的基因名,而是miRNA,lncRNA,甚至circRNA的ID,看起来很陌生罢了。感兴趣可以细读表达芯片的公共数据库挖掘系列推文 ;