强大的pdf文件操作小工具
前言
作为程序员,大家都知道的,总是会被技术小白问各种跟编程没什么关系的硬件、软件问题。曾经被一技术小白同事问到有没有什么办法合并pdf文件,当时自己也是一头雾水,因为自己工作生活很少会去操作pdf文件,而当时公司对开发人员的电脑权限管理很严格,不论是上网还是安装软件,都受到很大限制,最后硬着头皮忙活了一阵子也没在解决。
前两天在写批处理程序的时候,发现批处理程序是有合并文件的命令的,我忽然想起之前这个同事的问题,就试了一下合并pdf,然而并不行。虽然失落了一下,但本着学习的精神还是百度了一下关于pdf的一些知识,发觉大部分操作pdf文件的软件不仅安装费事,还基本都要收费,我去,连我程序员都嫌费事的事,好意思都教小白么?不过当我试了下pdftk,瞬间就被吸引了,因为用起来真的很简单,只要稍稍加工一下,就可以扔给小白们用了。
认识PDFtk
PDFtk(官网:https://www.pdflabs.com/tools/pdftk-the-pdf-toolkit/)是一款国外开发的软件,目标是使PDF更容易操作。官网上挂着一些客户软件的核心功能其实也是要收费才能用,但是它有一个服务器版本是免费的,这就是本篇文章的主角。PDFtk支持合并、旋转、加水印、加附件、加密、
下载安装
下载地址:https://www.pdflabs.com/tools/pdftk-server/
选择符合操作系统的版本下载,安装过程就不表了,小白式的安装就可以。安装成功后安装目录的bin目录会有libiconv2.dll和pdftk.exe文件,这就是操作pdf的PDFtk工具。环境变量也多了这个工具的路径。如果有像博主这样公司不给安装软件的,复制这两个文件就可以。
操作命令
官网(https://www.pdflabs.com/docs/pdftk-cli-examples/)上有举了一些例子,这里整理成批处理命令方便小白,相关命令保存为.bat文件,然后把希望操作的pdf文件和.bat文件置于同一目录即可。
合并文件夹内所有pdf,输出combind.pdf
@echo offpdftk %cd%\*.pdf cat output %cd%\combined.pdf
把多个PDF的不同页面组合成一个新的PDF文档,这里取base1.pdf的第一页,base2.pdf的第一页,输出combined2.pdf
@echo offpdftk A=%cd%\base1.pdf B=%cd%\base2.pdf cat A1 B1 output %cd%\combined2.pdf
旋转PDF,旋转的角度为上北下南左西右东(north\south\west\east),如下例,combined第一页向右旋转而其他保持不变则旋转参数为1east 2-end,如果全部旋转则是1-endeast(注意:这里没有空格)
@echo offpdftk %cd%\combined.pdf cat 1east 2-end output %cd%\rotate.pdf
使用128位强度对PDF进行所有者加密(owner password),加密后PDF文件处于只读状态,没有所有者密码不能对该PDF做各种文件操作。这里对base1.pdf进行所有者加密,密码为foopass,输出文件为poopass.128.pdf
@echo offpdftk %cd%\base1.pdf output %cd%\foopass.128.pdf owner_pw foopass
同上,同时给PDF加上访问者密码(会弹出一个密码输入框)此例原文件为in.pdf,加密后文件为mydoc.128.pdf,所有者密码为foopass,访问者密码为baz
@echo offpdftk %cd%\base1.pdf output %cd%\foopassbaz.128.pdf owner_pw foopass user_pw baz
解密PDF文档,input_pw空一格,然后是所有者密码,这里输入文件为加密文件foopassbaz.128.pdf,输出文件nopass.pdf,输出文件会去掉所有者密码和访问者密码。
@echo offpdftk %cd%\foopassbaz.128.pdf input_pw foopass output %cd%\nopass.pdf
加水印,以下命令会把stamp.pdf当成背景水印(即stamp.pdf叠加在底层)合到base1上并输出stampback.pdf,如果想把stamp.pdf合成base1的前景水印(即stamp.pdf叠加在表层),把以下的backgroud换成stamp即可。
@echo offpdftk %cd%\base1.pdf background %cd%\stamp.pdf output %cd%\stampback.pdf
以上就是常用的pdf文件操作的相关命令了,实际上PDFtk还有提供了不少功能,具体可与参照官网和输入在CMD输入pdftk --help查看相关资料,这里就不一一写出来了,毕竟小白们没用到那么细致的功能。
附件
附件提供了自己测试用的pdf和小工具libiconv2.dll和pdftk.exe文件,如果有朋友不方便安装(像我的上家公司)可以直接下载附件来操作。
参考:
http://blog.csdn.net/fresherman/article/details/5979204
https://www.pdflabs.com/docs/pdftk-cli-examples/