JAVA中 PDF文件转成TIFF文件的2种方式

由于在工作中使用到了PDF->TIFF的技术,所以稍微研究了一下实现方式,通过资料查阅,暂时发现了2种方式,2种方式有所区别:第一种方式转化后的tiff文件是黑白的,第二种方式转化后的tiff文件是有色彩的(跟PDF文件相同),如果不对色彩要求严格的话,建议使用第一种方式,因为转化的文件较小。

第一种PDF转化TIFF的方式(黑白):

注意主要依赖pdfbox的版本是1.8.9,而新版本的依赖不适用,例如2.0.0-RC2。

<dependency>
<groupId>org.apache.pdfbox</groupId>
<artifactId>pdfbox</artifactId>
<version>1.8.9</version>
<scope>compile</scope>
</dependency>
    /**
     * 把PDF读入输入流,转化每一页为TIF
     * @param inputStream PDF输入流
     * @param dir         存放的路径
     * @param dpi         dpi    
     * @return 转化后的tif文件列表
     */
    public List<File> pdf2tif(InputStream inputStream, File dir, int dpi) {
        try (PDDocument pdf = PDDocument.load(inputStream)) {
            BufferedImage[] images = new BufferedImage[pdf.getNumberOfPages()];
            TiffPainter painter = new TiffPainter();
            List<File> files = new ArrayList<>();
            long suffix = System.currentTimeMillis();
            for (int i = 0; i < images.length; i++) {
                PDPage page = (PDPage) pdf.getDocumentCatalog().getAllPages().get(i);
                BufferedImage image;
                image = page.convertToImage(BufferedImage.TYPE_BYTE_BINARY, dpi);
                images[i] = image;
                File file = new File(dir.getAbsolutePath() + File.separator + suffix + "-" + (i + 1) + ".tiff");
                painter.write(image, file);
                files.add(file);
                System.out.println(file.getAbsolutePath());
            }
            return files;
        } catch (IOException e) {
            e.printStackTrace();
            return null;
        }
    }

 

 

第二种PDF转化TIFF文件的方式(有色彩):

注意主要的依赖:(maven可能拉不下来,建议去网上下载)

<dependency>
<groupId>com.sun.media</groupId>
<artifactId>jai_codec</artifactId>
<version>1.1-mr</version>
</dependency>
<dependency>
<groupId>javax.media</groupId>
<artifactId>jai_core</artifactId>
<version>1.1-mr</version>
</dependency>
<dependency>
<groupId>com.sun.medialib</groupId>
<artifactId>mlibwrapper_jar</artifactId>
<version>1.1</version>
</dependency>
<dependency>
<groupId>org.apache.pdfbox</groupId>
<artifactId>pdfbox</artifactId>
<version>2.0.0-RC2</version>
</dependency>
/**
     * 从输入流读取pdf,转化为tiff后写入输出流.<br/>
     * @param is  输入流,提供pfg内容.
     * @param outPath  输出目录.
     */
    public static List<File> pdf2Tiff(InputStream is, String  outPath) {
        PDDocument doc = null;
        FileOutputStream fos = null;
        List<File> files = new ArrayList<>();
        try {
            doc = PDDocument.load(is);
            int pageCount = doc.getNumberOfPages();
            PDFRenderer renderer = new PDFRenderer(doc); // 根据PDDocument对象创建pdf渲染器
            List<PlanarImage> piList = new ArrayList<PlanarImage>(pageCount - 1);
            TIFFEncodeParam param = new TIFFEncodeParam();// 创建tiff编码参数类
            param.setCompression(TIFFEncodeParam.COMPRESSION_DEFLATE);// 压缩参数
            param.setExtraImages(piList.iterator());// 设置图片的迭代器
            for (int i = 0; i < pageCount; i++) {
                BufferedImage fimg = renderer.renderImageWithDPI(i, DPI, ImageType.RGB);
                PlanarImage fpi = JAI.create("mosaic", fimg); // 通过JAI的create()方法实例化jai的图片对象
                File file = new File(outPath + (i + 1) + ".tiff");
                fos = new FileOutputStream(file);
                ImageEncoder enc = ImageCodec.createImageEncoder("tiff", fos, param);
                enc.encode(fpi);// 指定第一个进行编码的jai图片对象,并将输出写入到与此
                files.add(file);
                if (fos !=null) {
                    fos.close();
                }
            }
        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            try {
                if (doc != null)
                    doc.close();
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
        return files;
    }

 

上一篇:如何从ImageIO中排除特定的TIFF阅读器?


下一篇:.NET Tiff发行C#