3分钟读取、汇总300个pdf文件内容!多简单!多快!| PA实战应用

我在文章《Excel里这段读取pdf文件内容的代码,你一定要收藏好了!》里面,介绍了使用VBA的方式读取PDF文件内容的方法,并给出了完整代码,不算长,大概不到100行的样子:

……

但是,这对很多不熟悉VBA的朋友来说,可能仍然觉得很难,而且,如果还要结合实际情况应用,比如结合其他代码调用等等,就更难了。

现在,有了power automate,这个问题就太简单了!完全无码!仅4步拖拉拽选设置一下即可:

step-01 获取文件夹中的文件

Step-02 设置循环for each

即模拟人不断循环打开前面步骤所获取的每一个pdf文件。

Step-03 从pdf提取文本

将该步骤放在for each里面,即会针对每一个pdf,循环地提取其中的文本

Step-04 将文本写入文件

同样放在循环for each里面,从pdf提取文本后面,跟咱们手工打开一个文件,然后从其中提取(如复制粘贴)文本内容类似。

通过以上简单的4个步骤设置,即可以实现将同一个文件夹下的所有pdf文档内容,提取合并到一个文本文件!

而且,提取的速度非常快,比如我测试的近300个pdf文件:

提取时间不到3分钟!

当然,用Power Automate单纯将pdf文件的内容提取汇总到一起,只是我们做数据分析自动化的一个小环节,内容提取后,如何继续驱动Power BI等工具进行数据的刷新、分享……,使所有重复性的工作合成一体,实现绝大部分过程的自动化,才是Power Automate的真正价值!

(0)

相关推荐