为什么要学习编程?

帮同学处理一下他从公司拿到的差异分析结果,当然,给我的是Excel表格,老规矩,导出csv然后读入R,然后准备顺手画个火山图,做个GO/KEGG富集分析。下意识的看了看数据结构,然后顺手按照基因名排序了一下,哈哈哈~

这是一个大坑。

就因为这个还有两篇文章;

  • Mistaken Identifiers: Gene name errors can be introduced inadvertently when using Excel in bioinformatics 2004年

  • Gene name errors are widespread in the scientific literature 2016年

也有人在论坛上面发问,高达2K的阅读量: https://www.biostars.org/p/211861/

Some gene names start with APR/MARC/SEPT* etc default converted into date format.

我们生信技能树论坛也有人分享过: Excel-坑你的基因名没商量!

随意篡改20%的遗传学论文!
可就在今年8月份,三位科学家在《Genome Biology》期刊上发表论文,称他们发现20%的遗传学论文包含了Excel软件导致的基因名转换错误。他们对论文进行的扫描显示,科学文献中的基因名错误十分普遍,在默认设置下Excel软件会将基因的名字转换成日期或浮点数。
举例来说,基因名字SEPT2和MARCH1会被分别转换成2-Sep和1-Mar;标识符2310009E1被转换成浮点数2.31E+13。

但是,如果你会编程的话,事情就很简单咯

a$Gene.Symbol=unlist(lapply(as.character(a$gene_assignment),function(x){trimws(strsplit(x,'//')[[1]][2])}))

编辑:jimmy

(0)

相关推荐

  • Fgf21基因敲除小鼠模型构建技术原理

    Fgf21基因敲除小鼠背景信息 FGF家族成员具有广泛的促有丝分裂和细胞存活特性,并参与多种生物过程,包括胚胎发育.细胞生长.形态发生.组织修复.肿瘤生长和侵袭. 成纤维细胞生长因子21(FGF21) ...

  • 转录组Count格式数据转化为FPKM/TPM格式

    很多时候我们得到的转录组格式为Count,例如在TCGA数据库下载的数据,如果我们想使用FPKM格式或者TPM,那么就需要转换,不过TCGA数据库也提供了FPKM的格式,貌似miRNA数据只有Coun ...

  • 为0基础想要学习编程

    很多人都想转行互联网行业,无论是因为兴趣还是薪资,想要转行的人群都要面对一个问题,那就是编程的学习. 无论你是学生还是在职人员想要跨界转行,或者只是兴趣所致,都要有一个方向和大概的学习思路,否则只会在 ...

  • 为什么要学习少儿编程?从发明少儿编程的初衷看

    这是Tony的第84篇原创 01 上一篇文章说了少儿编程被大众所熟知的标志性事件是麻省理工学院(MIT)设计开发开发了一款针对少儿的图形化编程软件Scratch,由于它是采用图形化的编程方式. 我们不 ...

  • 医生得糖尿病25年,血糖一直没高过,他的健康食谱,我们要学习

    糖尿病这种疾病,多数患者都是吃出来的,现在大家的生活水平提高了,在饮食上吃得也越来越好了,这也是导致糖尿病和高血糖患病人数越来越多的原因,对于糖尿病的治疗,一个健康的饮食习惯也是非常重要的. 昨天我为 ...

  • 11个用于编程和开发的最佳Linux发行版[2021版]

    基于Linux的操作系统是最受欢迎的,并且最适合开发人员和程序员.大多数开发人员使用不同的Linux发行版来迅速完成工作并创建新的东西,但是作为我自己的前开发人员,我主要担心的一个问题是"我 ...

  • 普通二本安逸中堕落最后选择培训拿到13Koffer,有些人真不适合编程

    原本找汪哥是为了帮我筛选下offer的,但是既然要讲,那就来龙去脉捋一捋. 个人经历 我18年毕业于一普通二本,专业电子信息工程,当时校招也不想知道怎么想的,去一线城市进了一家客车企业,干起了机械专业 ...

  • PLC最全编程算法,收藏备用!

    蓝字   '电气达人"  PLC最全编程算法 PLC编程算法(1): PLC中无非就是三大量:开关量.模拟量.脉冲量.搞清楚三者之间的关系,你就能熟练的掌握PLC了. 1. 开关量也称逻辑量 ...

  • 中国科大成功研制62比特可编程超导量子计算处理器,实现可编程的二维量子行走

    合肥讯   中国科大中科院量子信息与量子科技创新研究院(以下简称量子创新研究院)潘建伟.朱晓波.彭承志等组成的研究团队,成功研制了62比特可编程超导量子计算原型机"祖冲之号",并在 ...

  • 西门子PLC编程经典实例

    一.小车往返运动 用S7-200实现小车往返的自动控制 ,控制过程为按下启动按钮 ,小车从左边往右边(右边往左边运动) 当运动到右边(左边)碰到右边(左边)的行程开关后 小车自动做返回运动,当碰到另一 ...

  • 工业机器人零基础PLC编程的基本步骤

    科学的PLC编程步骤其实很简单,但往往大多数工程师就是认为简单而忽略很多细节.细节的忽略,必然会在以后出现问题.想避免日后的问题,只有好好的遵守规则,没有规矩不成方圆,plc编程一样有其自身的规矩. ...