开始数据分析前,先收好这份 Excel 数据规范指南,可避过大部分坑
今天不聊案例,给大家汇总一下制作数据表的一些基本原则。
不管是初学者还是 Excel 老鸟,不少同学对于数据表的规范化和标准化仍然懵懵懂懂,以至于在工作中一不小心就给自己挖了坑,日后需要付出数倍的精力含泪填这些坑。
所以今天的教程,大家也可以看作是一份避坑指南。
一、一致性:
1. 同一对象的命名必须一致,比如,
“一月”和“1月”不要混用;
“一月 ”文字后面多了个空格,也不应该有。
2. 同一数据表中的格式要保持一致:比如,小数位数、千分位符、数字还是百分比,甚至对齐方式等。
3. 同一类型的工作簿、工作表的命名也必须一致、有规律,以便于日后批量修改。
二、规范性:
1. 数据格式规范:
一定要使用 Excel 可以识别的数据格式,比如,数值不要设置成文本格式;日期必须用真正的日期格式,而不是“2021.6.1”这种;
文本和数值要分开放在不同的单元格中,不要写成小作文,比如,
2. 表格结构规范:
源数据表应该制作成二维表,尽量不要使用三维表,因为不便于后续分析处理;
不要合并单元格!老生常谈了,不赘述;
尽量不要单元格内硬回车(Alt+Enter);
尽量不要使用多重标题、斜线表头;
标题不能为空、不能重复,尽量不要用数字作为标题;
不要在单元格中插入空格来排版;
不要有空行空列;
源数据不要有小计、合计行或列;
同一个工作表中只放一个数据表,如果一定要放两个,请错行错列放置;
三、专业性:
需要得出计算结果的单元格应该使用公式,而不是直接输入结果;别笑,真有人用计算器算出结果后填入单元格,把 Excel 当成了烧火棍;
引用其他表的数据,需要用公式,而不是直接填入,这样可以保持数据的联动性;
公式要具有封装性、可扩展性;
公式的参数需要正确使用单元格的绝对、相对、混合引用;
过于复杂的公式,可以充分利用辅助列,化繁为简;
不要过多使用数据有效性、条件格式和数组公式,这样会使 Excel 运算速度变慢;如果升级到 O365 以后,很多数组公式都可以被简单的函数所替代
四、安全性:
不希望让人修改的部分,尽量设置工作表保护,以免公式和数据被破坏;
需要多人填写的表格,可以通过设置下拉菜单、验证数据有效性来确保数据格式规范;
断开不必要的链接;
及时备份和建立副本
五、美观性:
使用与公司 Logo 一致的色系;
结构合理、重点突出、排版美观,方便阅读与打印;
尽量不要使用太多颜色,不要添加过多背景色;
删除非必要的格式、批注;
如需使用备注,请置于表尾;
字体、数字格式统一;
行高、列宽统一;
必要时对数据进行排序