菜鸟记166-浅谈数据清洗的几个思路

注:拍于2019年春节广西南宁青秀山


关键词:EXCEL2016;TRIM函数;替换;操作难度***

身为教学管理人员,经常要处理大量的数据,小菜最头疼的是其他来源的数据表,由于各种原因,往往会有一些不规范的数据混杂其中,比如某天小菜接到教务处王处长的指令,要统计分析多个学期学生评教情况,拿到数据小菜傻眼了:

图 1:数据示意图

您发现了吗?黄色底纹的单元格要么就是存在空格,要么就是存在文本类型数字……

接下来,小菜就和您分享一下拿到数据后,从哪些方面开展数据清洗工作。

步骤1:复制数据表

进行数据处理的第一要则:给自己留条后路!!!

所以强烈建议复制出工作表再操作,万一出错有回头的机会。

小菜经验之谈:当小菜还年轻的时候,直接SHIFT+DELETE删除了存储在服务器中的数据,结果……

步骤2:清除字符串或空格

接下来我们注意看数据中有没有多余的空格,比如我们可以用查找替换所有空格,在查找内容中按一个空格后点击全部替换即可,请看会动的图:

如果单元格中有的空格应该保留的,建议您使用TRIM函数来控制,该函数的作用是将单元格内容前后的空格去掉,但并不去除字符之间的空格。

请注意比较两种方法的差别

步骤3:截取字符串

有的时候还要根据需要数据进行截取,比如本例可以对身份证号码提取出生日和年龄等数据。

关于该部分应用,请参阅小菜前期分享过的文章。

菜鸟记137-计算一下自己还有多少天可以退休?

步骤4:替换单元格中的部分内容

接下来还有可能需要替换单元格中的部分内容,比如为了保密需要将身份证号码部分数字替换为星号。

关于该部分应用,请参阅小菜前期分享过的文章。

菜鸟记70-您用的查找替换能干这些事情吗?

小菜划重点:Replace/Substitute函数也强烈建议掌握

步骤5:关联其他数据表中的数据

处于数据分析的需要,我们还可能需要关联其他数据表中的数据,此时您需要用到的函数大概有VLOOKUP、LOOKUP、INDEX+MATCH等。

关于该部分应用,请参阅小菜前期分享过的文章。

菜鸟记6-做领导喜欢的工作表之下集——快速提取同类数据到单元格

菜鸟记48-VLOOKUP让数据自动匹配

菜鸟记49-哪些VLOOKUP闹的脾气

菜鸟记51-查询家族lookup的必杀技套路

《菜鸟记161-自己定制一个查询器》

《菜鸟记162-从多次测试中获取最好成绩,体育老师也可以教信息课!》

步骤6:……

小菜总结:其实进行数据清洗还有很多需要注意的细节,如果您在工作中有这样的烦恼,欢迎和小菜单线联系,咱们一起研究,共同学习提高。

今天就是这些,希望小菜的分享能帮到您或有所启发,欢迎您有问题联系,为小菜提供更多思路。

休息一下,休息一下

版权声明:文中所用图片除注明作者或出处外,均为本人亲自按动快门拍摄或截取,请勿盗用。

(0)

相关推荐

  • 如何将excel表1数据匹配到表2中来?

    在编辑excel表格时,有时候需要跨表格来导入数据,这就需要将其中一个表格的数据匹配到另一个表格中,那么大伙知道该怎么操作吗?下面就由小编来指导一下大家如何将excel表1数据匹配到表2中来. 1.打 ...

  • 浅谈批断八字的思路与步骤

    对于初学命理的人而言,相关的基础知识已经非常熟悉了,只是拿到一个八字后,不知从何入手,因为所有的基础知识都是片段式的,要把所有的基础知识运用与实际案例上,也是有些难度的,今天,给大家谈谈分析八字的思路 ...

  • 浅谈踢人下线的设计思路!(附代码实现方案)

    前言 前两天写了一篇文章,主要讲了下java中如何实现踢人下线,原文链接:java中如何踢人下线?封禁某个账号后使其会话立即掉线! 本来只是简单阐述一下踢人下线的业务场景和实现方案,没想到引出那么多大 ...

  • 思路编40:浅谈髌骨受限的治疗思路

    髌骨在股骨上滑行,就像我们的火车一样,它必需在股骨的髌轨迹上滑动,偏离了髌轨迹,就会影响我们膝关节的功能运动,产生膝关节各式各样的疼痛.当股二头肌损伤后,或因骨盆的偏移,出现股二头肌张力过大时,使小腿 ...

  • 浅谈石墨化焦的归类思路及依据适用

    在协调制度中,石油焦(petroleum coke)列于品目27.13,该品目注释规定:"石油焦(绿焦或煅烧焦)是裂化或干馏石油或沥青矿物油所剩的一种黑色多孔固体残余物,主要用作制造电极的原 ...

  • 【优秀入选论文】浅谈绿色涂装的规划思路

    浅谈绿色涂装的规划思路 刘多丽 周圆 刘辉 吉利汽车集团有限公司ME中心 浙江宁波 315336 摘要:本文介绍了汽车涂装国内外节能减排的现状,并对绿色涂装的"绿色"指标进行量化, ...

  • 浅谈鸟版荷兰盾设计思路的微妙变化

    如果联合国教科文组织只给一个国家颁发"设计之都"荣誉称号的话,我想那么这个国家非荷兰莫属了.     2012年4月7日是笔者鸟版荷兰盾收藏的收官之战日,当100盾的沙锥送到手中, ...

  • 菜鸟记165-有些单元格不用让领导看见,浅谈EXCEL中零值、错误值的处理

    关键词:EXCEL2016:零值:错误值:COUNTIF函数:IFERROR函数:操作难度* 温馨提示:结合以下文章阅读收获更大 <菜鸟记51-查询家族lookup的必杀技套路> < ...

  • 菜鸟记238-如何处理不规则的时间记录?谈一份学时统计表的变形记

    关键词:EXCEL2016:替换:MID函数:IF函数:分列:操作难度*** 某天,小菜在统计某项学生赛事学时统计时候,很开森郁闷地发现汇总上来的数据是这样的: 图1:源数据示意图 仔细分析,时间记录 ...

  • ​菜鸟记340-做好限制,数据采集更规范—谈知识应用的重要性!

    万一您身边的朋友用得着呢? 各位朋友早上好,小菜继续和您分享经验之谈,截止今日小菜已分享350+篇经验之谈,可以文章编号或关键词进行搜索 感谢近期持续分享的盆友:虫二.思考着.聪聪.人定规矩钱定人.天 ...