在写具体代码之前,咱们先了解一下Apache PDFbox API框架给我们提供的命令行工具。通过这个命令行工具,我们可以了解大部分
Apache PDFbox给我们提供的强大功能。
在我们运行命令之前,我们首先需要去下载这个命令行工具所依赖的jar文件,大家可以去下面的任何一个站点去下载。
http://apache.fayea.com/apache-mirror/pdfbox/1.8.5/pdfbox-app-1.8.5.jar
http://mirrors.cnnic.cn/apache/pdfbox/1.8.5/pdfbox-app-1.8.5.jar
http://apache.dataguru.cn/pdfbox/1.8.5/pdfbox-app-1.8.5.jar
http://mirrors.hust.edu.cn/apache/pdfbox/1.8.5/pdfbox-app-1.8.5.jar
http://mirror.bit.edu.cn/apache/pdfbox/1.8.5/pdfbox-app-1.8.5.jar
http://mirror.esocc.com/apache/pdfbox/1.8.5/pdfbox-app-1.8.5.jar
下载完成后,大家可以把这个jar放到本地电脑上的一个文件中,笔者就把其放在,d:/pdftest 目录下,
假设大家有一件配置好Java home的环境了。我们本人配置的是,jdk1.6.0; 你可以根据你实际的安装环境,
使用其他JDK的版本。
环境都准备好了,现在万事具备,只欠实际操作。但是在实际操作之前,给大家简单啰嗦一下,Apache
PDFBox项目到底自带了那些命令来操作PDF文件的呢?总的来说,其包括了下面的一些命令。
- PDFBox命令行工具
- Decrypt: 解密一个PDF文档
- Encrypt: 加密一个PDF文档
- ExtractText:从PDF文档中提取字符串
- OverlayPDF: 覆盖PDF文件
- PrintPDF : 打印PDF文件
- PDFDebugger: 列出PDF文档本身的信息
- PDFReader : 读取PDF文档
- PDFMerger: 合并PDF文档
- PDFSplit : 拆分PDF文档
- PDFToImage: 把PDF文档转换成一张图片
- TextToPDF: 把一段文本转换成一个PDF文件
- WriteDecodedDoc: 解压缩一个PDF文件
d:\pdftest>java -jar d:/pdftest/pdfbox-app-1.8.5.jar TextToPDF d:/pdftest/csdnblog.pdf d:/pdftest/test.txt
(2) 既然我们已经创建好了,那么我们就用命令行工具:PDFReader 查看一下,
D:\pdftest>java -jar d:/pdftest/pdfbox-app-1.8.5.jar PDFReader d:/pdftest/test.pdf
(3) 在上面我提到了,生成的test.pdf 有两页。现在我们就用PDFSplit命令把test.pdf拆成两个PDF文件。
d:\pdftest>java -jar d:/pdftest/pdfbox-app-1.8.5.jar PDFSplit -startPage 1 -split 1 d:/pdftest/test.pdf
其中 -startPage 1 表示从第一页开始拆分
-split 1 表示被拆分后,每个单独的被拆分的PDF文件是多少页
下图是拆分后的结果,可以看出test.pdf 被拆分成了2个PDF文件,test-0.pdf和test-1.pdf
(4)最后给大家展示一下PDFDebugger命令行工具的使用。
D:\pdftest>java -jar d:/pdftest/pdfbox-app-1.8.5.jar PDFDebugger d:/pdftest/test.pdf执行上面的命令后,将会弹出下面的窗体。其显示了PDF文件本身的一些描述信息。