由于项目的需要,最近在学习APache PDFbox API,Apache PDFbox API是Apache Java 开源社区中个一个项目,其受Apache 版权 V2的保护,其提供了下面的功能:
(1)文本的提取
即在PDF文件里面把文本内容提取出来。
(2) 合并和拆分PDF文档
可以把几个PDF合并成一个PDF文件,也可以把一个PDF文件拆分成多个PDF文件。
(3) 表单填充
从PDF文件的表单中提取数据或者写入数据到PDF表单中。
(4) PDF/A的校验
根据PDF/A ISO 标准校验PDF文档
(5)打印PDF
通过Java的API去打印PDF文件
(6) 把PDF转换成图片
把PDF文件转换成图片
(7) 创建PDF文件
(8) PDF签名
在本系列的文章中,我将会逐一的给大家展示其API的使用。当前最新的PDFbox API版本是1.8.5,大家可以去https://pdfbox.apache.org/downloads.html#recent 这个网站上面下载。如果大家英文比较好的话,可以去其官方网站去进一步了解其框架的架构,具体的使用方式等。