将WORD简历数据汇总到Excel,用Power Query竟然这么简单?
小勤:大海,公司汇总了所有应聘者的简历,但都是分散的word文件,一个人一份,有没有办法将其中的姓名、性别、手机和邮箱等信息汇总到Excel里啊?
大海:简历的格式是怎样的?
小勤:嗯,都是统一的简历表,其实就是从网站上下载下来的表格,都放在一个文件夹下面了:
大海:那就好办。估计用Power Query能轻松解决。
小勤:PQ还能批量导入word的数据?我还想着非要VBA不可了!
大海:嗯,有的word文件可以从PQ试试,反正你先另存一份,试了不行又没什么损失,万一成功了呢?
Step-01:从文件夹汇总数据
Step-02:筛选扩展名为doc(或者docx)的行——一个完整的word文档内部可能会含各种xml信息,PQ在导入word文档时,会识别出来,提取内容只需要对扩展名为doc(或者docx)的部分进行后续处理即可。
Step-03:添加自定义列,提取word中的内容,公式=Web.Page([Content])
Step-04:展开提取的word内容
Step-05:继续展开其中的数据内容
——你看!真的成功了!接下来我们就可以筛选出来需要的数据了。
Step-06:筛选需要保留的信息
Step-07:这时候,数据都出来了,你看:
小勤:太666666了!对了,其中为什么用的函数是Web.Page呢?
大海:一般来说word文件是不能直接通过Power Query来汇总的,但有的word文件因为其中的表是从网上下载下来或复制下来的,这些表其实就是一段html代码(网页),这种情况下,就可以用Web.Page函数解析出来。
小勤:那如果是普通的word文件呢?
大海:那很可能不能直接用函数解析出来,但可以将word另存为html文档,然后再通过Web.Page函数进行汇总。
小勤:原来这样,真是666666啊。