Power Query批量合并Excel,数据不是从第一行开始怎么办?

这种情况确实很常见,因为大多数Excel表都会有个表头信息,具体的明细数据从下面的某行才开始,比如下面示例中的三个表就是这样:

这三张表的数据都是从第5行才开始的,并且数据字段的顺序也不一致,这种情况下怎样批量合并指定的列呢?

难道需要把每个表打开,删除表头后再合并吗?这当然也是一个笨办法,不过这不符合我们利用PowerQuery批量合并提升效率的初衷,下面就给出一个这种类型表格的批量合并思路。

总体步骤和上篇文章类似,不过中间多了一个处理步骤,以及利用了两个M函数。

下面进入分步详细操作:
↑ 获取数据>文件夹
↑ 点击“转换数据”进入PowerQuery编辑器
↑ 添加列>自定义列
↑ 自定义列公式:Excel.Workbook([Content])
这里的Excel.Workbook无需加第二个参数,因为第一行本来也不是标题行,将表的第一行作为标题没有意义。

Tips:利用PowerQuery进行数据处理时,可以先把其他无关列都删掉,看起来更加清爽,包括之后的步骤,如果展开后,发现有无用的列,可以随时删除。
↑ 展开自定义列
展开以后,并不是像上篇文章一样,接着展开[Data]列,而是再添加一个自定义列:

Table.PromoteHeaders(

Table.Skip([Data],4)

)

↑ 添加自定义列
这串M函数的含义已经用注释说明,其实逻辑很简单,由于原始数据表格是从第5行开始的,所以先跳过前4行数据,并将第五行数据,作为表的标题行,然后展开这个新的自定义列,就可以正常提取并合并特定的列了。
比起上一篇文章,只是多了一个添加自定义列的步骤,利用两个M函数:Table.PromoteHeaders和Table.Skip,就可以轻松解决批量合并时跳过表格前几行的问题,并且也可以选择合并特定的某几列数据。
关于PowerQuery批量汇总Excel,如果你还有其他问题,欢迎留言分享,我们一起解决。
本文的练习数据,可以在「PowerBI星球」公众号对话框发送关键字“批量合并Excel指定列”下载。
(0)

相关推荐