Excel应用大全 | 来认识Excel数据源吧!
统一的数据获取和转换体验
从 Excel 2016 开始,Excel 引入了一组强大的数据获取和转换工具 Power Query,使用户可以轻松地连接、 合并和组织来自多种来源的数据。在 Excel 2019 中,【数据】选项卡上数据导入和转换相关功能进行了布局调整,如图 2-1 所示,统一的使用体验得到了进一步加强。无论是各种离线文件,还是企业级数据库,甚至 Azure 和联机服务等,Excel 的数据获取和转换功能都可以轻松处理。
2-1 Excel 2019 上和2016 下【数据】选项卡对比
文本数据
文本数据是指以纯文本形式存储的表格数据,主要包括数字和文本,日期则可视作数字和文本的组合。文本数据文件是一个字符序列,使用任意文本编辑器都可以查看和编辑其内容。文本数据文件具备良好的跨平台适应性,在 Windows 中制作的文本数据文件,可以在Mac 和 Linux 系统中直接使用,反之亦然。除此之外,绝大多数编程语言都可以轻松地解析文本数据文件。因此,文本数据经常作为不同系统之间导入和导出、用户或网站之间交换数据的文件格式。
使用文本数据时一定要注意文件的编码格式,常用的编码格式有 UTF-8 和 GB2312 等。借助文本编辑器(如免费编辑器软件 Notepad++)可以查看文件的编码格式。如图 2-2 所示,文件内容看似相同,但是文件格式却不完全相同,这两个文件分别使用了 UTF-8 BOM和 GB2312 格式。如果使用不正确的格式打开或导入文本文件,可能导致显示乱码。
2-2 不同编码格式的文本数据文件
常用的文本文件格式有 CSV、XML 和 JSON 等。
1. CSV 数据
CSV(字符分隔值,其全称为 Comma-Separated Values)是一种被广泛使用的通用文件格式。虽然被统称为 CSV 文件,但是其文件扩展名并不限于 CSV,也可以是 TXT、TSV和 PRN 等,甚至可以是其他扩展名。通常 CSV 文件具备如下几个特点。
(1)数据记录按照行的形式保存在文件中。
(2)数据记录之间使用某种换行符(不同平台或软件中有差异)分隔。
(3)每个记录行都具备相同数量的字段序列,并且排列顺序相同。
(4)在一个记录行中,字段之间使用指定分隔符进行分隔,典型分隔符有制表符、分号、逗号和空格等,当然也可以使用其他字符作为字段分隔符。
严格来说 CSV 不是一种数据格式,因为并不存在 CSV 文件格式通用标准,只是在RFC 4180中对其进行了基础性的描述,系统之间完全可以定义私有的专用 CSV 格式标准用于数据交换。在这样宽松的约束条件下,可想而知会产生很多 CSV 变体,也就无法保证 CSV 文件完全互通,但是这并不妨碍 CSV 文件成为简单数据交换业务场景中的常用文件格式。