Excel应用大全 | 来认识Excel数据源吧!

一本书教会你分分钟搞定数据分析!
跟着小编一起来来认识一下Excel丰富多样的数据源吧!

统一的数据获取和转换体验

从 Excel 2016 开始,Excel 引入了一组强大的数据获取和转换工具 Power Query,使用户可以轻松地连接、 合并和组织来自多种来源的数据。在 Excel 2019 中,【数据】选项卡上数据导入和转换相关功能进行了布局调整,如图 2-1 所示,统一的使用体验得到了进一步加强。无论是各种离线文件,还是企业级数据库,甚至 Azure 和联机服务等,Excel 的数据获取和转换功能都可以轻松处理。

2-1 Excel 2019  上和2016  下【数据】选项卡对比

文本数据

文本数据是指以纯文本形式存储的表格数据,主要包括数字和文本,日期则可视作数字和文本的组合。文本数据文件是一个字符序列,使用任意文本编辑器都可以查看和编辑其内容。文本数据文件具备良好的跨平台适应性,在 Windows 中制作的文本数据文件,可以在Mac 和 Linux 系统中直接使用,反之亦然。除此之外,绝大多数编程语言都可以轻松地解析文本数据文件。因此,文本数据经常作为不同系统之间导入和导出、用户或网站之间交换数据的文件格式。

使用文本数据时一定要注意文件的编码格式,常用的编码格式有 UTF-8 和 GB2312 等。借助文本编辑器(如免费编辑器软件 Notepad++)可以查看文件的编码格式。如图 2-2 所示,文件内容看似相同,但是文件格式却不完全相同,这两个文件分别使用了 UTF-8 BOM和 GB2312 格式。如果使用不正确的格式打开或导入文本文件,可能导致显示乱码。

2-2 不同编码格式的文本数据文件

常用的文本文件格式有 CSV、XML 和 JSON 等。

1. CSV 数据

CSV(字符分隔值,其全称为 Comma-Separated Values)是一种被广泛使用的通用文件格式。虽然被统称为 CSV 文件,但是其文件扩展名并不限于 CSV,也可以是 TXT、TSV和 PRN 等,甚至可以是其他扩展名。通常 CSV 文件具备如下几个特点。

(1)数据记录按照行的形式保存在文件中。

(2)数据记录之间使用某种换行符(不同平台或软件中有差异)分隔。

(3)每个记录行都具备相同数量的字段序列,并且排列顺序相同。

(4)在一个记录行中,字段之间使用指定分隔符进行分隔,典型分隔符有制表符、分号、逗号和空格等,当然也可以使用其他字符作为字段分隔符。

严格来说 CSV 不是一种数据格式,因为并不存在 CSV 文件格式通用标准,只是在RFC 4180中对其进行了基础性的描述,系统之间完全可以定义私有的专用 CSV 格式标准用于数据交换。在这样宽松的约束条件下,可想而知会产生很多 CSV 变体,也就无法保证 CSV 文件完全互通,但是这并不妨碍 CSV 文件成为简单数据交换业务场景中的常用文件格式。

2. XML 数据
XML(可扩展标记语言,其全称为 Extensible Markup Language)是一种标记语言。XML 是由 SGML(标准通用置标语言,其全称为 The Standard Generalized Markup Language)发展而来的,1998 年 2 月 W3C(万维网联盟)发布 XML 1.0 规范,自此之后XML 被广泛地应用于跨平台数据交换。XML 文件的结构与 HTML 文件很相似,但是二者的用途是有明显区别的,HTML 用来展示各种数据,而 XML 是用来传送和交换数据的,并不用来展示数据。
XML 文档中字符可以分为两类:标记和内容。标记通常以“<”作为起始标记,并以“>”作为结尾标记,不属于标记的字符就是内容。
3. JSON 数据
JSON(JavaScript 对象表示法,其全称为 JavaScript Object Notation)使用完全独立于任何编程语言的文本格式来表示数据,这是一种轻量级的数据交换格式。JSON 是ECMAScript 规范(欧洲计算机协会制定的 JavaScript 规范)的一个子集,详细的 JSON 标准规范请参考在线文档(http://json.com/specs/)。
由于 JSON 天生具备了简洁和清晰的层次结构,易于计算机进行生成和解析,从 2005年开始,JSON 成为主流的网络数据传输和交互格式。进行网页数据抓取时,很多页面请求的返回结果都是 JSON 格式的数据。
既然 JSON 脱胎于 JavaScript,那么可想而知,想要应用 JSON 数据一定要了解一些JavaScript 的基础知识。在 JavaScript 编程中,一切都是对象,这是 JavaScript 语言的特点之一。JavaScript 所支持的数据类型(数字、数组、字符串等)都可以使用 JSON 格式来表示。但是这并不意味着 JSON 只能应用于 JavaScript,事实上绝大多数编程语言都可以很方便地使用 JSON。
还想要学习其他数据处理与分析的知识吗?快来看看应用大全吧!
(0)

相关推荐