3分钟读取、汇总300个pdf文件内容!多简单!多快!| PA实战应用
我在文章《Excel里这段读取pdf文件内容的代码,你一定要收藏好了!》里面,介绍了使用VBA的方式读取PDF文件内容的方法,并给出了完整代码,不算长,大概不到100行的样子:
……
但是,这对很多不熟悉VBA的朋友来说,可能仍然觉得很难,而且,如果还要结合实际情况应用,比如结合其他代码调用等等,就更难了。
现在,有了power automate,这个问题就太简单了!完全无码!仅4步拖拉拽选设置一下即可:
step-01 获取文件夹中的文件
Step-02 设置循环for each
即模拟人不断循环打开前面步骤所获取的每一个pdf文件。
Step-03 从pdf提取文本
将该步骤放在for each里面,即会针对每一个pdf,循环地提取其中的文本
Step-04 将文本写入文件
同样放在循环for each里面,从pdf提取文本后面,跟咱们手工打开一个文件,然后从其中提取(如复制粘贴)文本内容类似。
通过以上简单的4个步骤设置,即可以实现将同一个文件夹下的所有pdf文档内容,提取合并到一个文本文件!
而且,提取的速度非常快,比如我测试的近300个pdf文件:
提取时间不到3分钟!
当然,用Power Automate单纯将pdf文件的内容提取汇总到一起,只是我们做数据分析自动化的一个小环节,内容提取后,如何继续驱动Power BI等工具进行数据的刷新、分享……,使所有重复性的工作合成一体,实现绝大部分过程的自动化,才是Power Automate的真正价值!
赞 (0)