PQ-数据获取:CSV(及文本文件)数据源获取及需要注意的问题
CSV(或文本文件)的导入方式与外部Excel文件的导入方式基本一致,本文章从2个例子说明规范CSV文件的导入以及非规范CSV文件导入时需要注意的问题,导入文本文件的方法与CSV的基本一致,不单独举例。
一、规范CSV文件的导入
规范的CSV文件,即数据很干净整洁,是标准的标题+数据方式,如下图所示:
这个导入比较简单,方法如下:
Step-1:【新建查询】-【从文件】-【从CSV】
Step-2:选择数据所在的文件-【导入】
数据正常导入,结果如下:
二、非规范CSV文件的导入及注意问题
非规范的CSV文件,即除了标准的标题+数据外,还有其他额外信息。如CSV中经常在数据前加说明文字,如下图所示:
对于这个数据,我们按前面标准的方法导入,结果却是这样的:
尼玛,怎么只有一列?
原来,CSV是靠逗号分隔的,但第一行里没有逗号,于是被Power Query识别为只有一列——有时候,太智能自动化了也不是什么好事。
那怎么办呢?
实际上,Power Query导入的一些参数是可以修改的。如下图所示,单击【应用步骤】中【源】右边的齿轮按钮:
出现以下窗口(因为是CSV类文件,所以Power Query中默认以CSV文档的方式导入):
为了能避免CSV类文档中逗号分隔的问题,这里通过选择改成“文本文件”:
这个时候,整个文件会被当做只有一列:
数据进来了,第一行不要的,先删掉:
按逗号拆分列:
最后,提升第一行为标题:
终于搞定,后面想搞啥就搞啥去吧。
赞 (0)