PQ-数据获取:CSV(及文本文件)数据源获取及需要注意的问题

CSV(或文本文件)的导入方式与外部Excel文件的导入方式基本一致,本文章从2个例子说明规范CSV文件的导入以及非规范CSV文件导入时需要注意的问题,导入文本文件的方法与CSV的基本一致,不单独举例。

一、规范CSV文件的导入

规范的CSV文件,即数据很干净整洁,是标准的标题+数据方式,如下图所示:

这个导入比较简单,方法如下:

Step-1:【新建查询】-【从文件】-【从CSV】

Step-2:选择数据所在的文件-【导入】

数据正常导入,结果如下:

二、非规范CSV文件的导入及注意问题

非规范的CSV文件,即除了标准的标题+数据外,还有其他额外信息。如CSV中经常在数据前加说明文字,如下图所示:

对于这个数据,我们按前面标准的方法导入,结果却是这样的:

尼玛,怎么只有一列?

原来,CSV是靠逗号分隔的,但第一行里没有逗号,于是被Power Query识别为只有一列——有时候,太智能自动化了也不是什么好事。

那怎么办呢?

实际上,Power Query导入的一些参数是可以修改的。如下图所示,单击【应用步骤】中【源】右边的齿轮按钮:

出现以下窗口(因为是CSV类文件,所以Power Query中默认以CSV文档的方式导入):

为了能避免CSV类文档中逗号分隔的问题,这里通过选择改成“文本文件”:

这个时候,整个文件会被当做只有一列:

数据进来了,第一行不要的,先删掉:

按逗号拆分列:

最后,提升第一行为标题:

终于搞定,后面想搞啥就搞啥去吧。


(0)

相关推荐