Excel Power Query的数据处理过程
小勤:大海,前面有好多个PowerQuery的操作例子,但每次都一下子进入实际操作中,反而对整体的操作思路没有一个直观的认识。能简单讲一下PQ的总体过程是怎样的吗?
大海:好的。假设我们要用PQ完成一项任务,比如前面的每一个独立例子:二维表转一维表、分离金额、提取字符串、批量导入文本文件、修整文本内容等等,你仔细看一下,其实从大的层面上,都是3个步骤:数据选取(新建查询)→数据处理(清洗转换)→数据上传(加载)。这是每项任务都要做的事情。具体如下图所示:
数据选取(新建查询):即对需要操作的数据接入到PQ功能中;
数据处理(清洗转换):即对接入到PQ功能的数据进行增、删、修、转换、合并、拆分、排序、筛选、透视、逆透视等操作,最终变成自己需要的数据。
数据上传(加载、刷新):将在PQ中处理好的数据上传(加载)到指定的地方,并在数据源发生改变的情况下,按需要刷新自动得到最新的结果数据。
小勤:为什么用PQ这样操作后,数据源有改变的时候可以实现自动的刷新呢?
大海:这是因为PQ对处理过程进行了记录,这些记录可以在PQ的功能窗口中很方便查看,并可以按需要对每一步进行修改或调整(顺序等):
小勤:那这个不很像是一个录制宏的过程吗?
大海:的确是有点像录制宏的过程,但比录制宏要人性化,而且功能也强大了很多,并对所有步骤进行了可视化的管理,而不像录制宏里仅有一堆的代码。
小勤:但代码有代码的好处啊,比如假设我学会了VBA的话,代码的灵活性将更好、可扩展性将更强。
大海:对的。其实PQ最终也是形成了一系列的代码,你也可以按需要进行更改,但一般除了需要自定义函数以为,大部分的工作是可以直接通过点点点的可视化操作方式来完成相应调整的。下面这个图能大致说清楚操作步骤跟代码之间的完整对应关系:
小勤:太赞了。我终于知道PQ的大致工作原理了。
赞 (0)