Java 利用LibreOffice将Office文档转换成 PDF,进而转图片,实现在线预览功能

异步转换

通过调用操作系统命令的方式实现,这个转换是异步的,根据文件的大小需要的时间不确定,如果在上传之后就要立即预览,需要用同步方式。 - 优点:实现方式简单,不需要额外配置信息,不需要添加第三方依赖库(当然 LibreOffice 是必须要安装的)。 - 缺点:发送指令之后,转换是否成功,是否有异常,无法获知,也就是说,转换是否成功,是不确定的。当然,通过严格的测试,一般还是可以保证转换的可靠性的。

同步转换

用到了 JodConverter:https://github.com/sbraconnier/jodconverter - 优点:转换是同步的,转换成功与否是确定的。 - 缺点:代码运行期需要启动 LibreOffice 服务,需要占用操作系统资源,相对于异步转换方式,需要依赖第三方库,需要额外配置信息。

添加依赖(仅同步方式需要)

<dependency>
    <groupId>org.jodconverter</groupId>
    <artifactId>jodconverter-local</artifactId>
    <version>4.2.4</version>
</dependency>

在 resources 目录yml 文件配置参数(仅同步方式需要)

libreOffice:
  ##LibreOffice安装主目录
  libreOfficeHome: C:/Program Files/LibreOffice
  ##开启多个LibreOffice进程,每个端口对应一个进程
  portNumbers: 2002
  ##任务执行超时为5分钟
  taskExecutionTimeoutMinutes: 5
  ##任务队列超时为1小时
  taskQueueTimeoutHours: 1

转换类 LibreOfficeUtil

import org.jodconverter.JodConverter;
import java.io.File;

public class LibreOfficeUtil {

    /*
     * 同步转换
     * @Date    2021年11月09日 11:41:04
     * @Param   [sourceFile, targetFile]
     * @Return  boolean
     */
    public static boolean convertOffice2PDFSyncIsSuccess(File sourceFile, File targetFile) {
        try {
            OfficeManagerInstance.start();
            JodConverter.convert(sourceFile).to(targetFile).execute();
        } catch (Exception e) {
            e.printStackTrace();
            return false;
        }
        return true;
    }

    /**
     * 利用 LibreOffice 将 Office 文档转换成 PDF,该转换是异步的,返回时,转换可能还在进行中,转换是否有异常也未可知
     * @param filePath       目标文件地址
     * @param targetFilePath 输出文件夹
     * @return 子线程执行完毕的返回值
     */
    public static int convertOffice2PDFAsync(String filePath, String fileName, String targetFilePath) throws Exception {
        String command;
        int exitStatus;
        String osName = System.getProperty("os.name");
        String outDir = targetFilePath.length() > 0 ? " --outdir " + targetFilePath : "";

        if (osName.contains("Windows")) {
            command = "cmd /c cd /d " + filePath + " && start soffice --headless --invisible --convert-to pdf ./" + fileName + outDir;
        } else {
            command = "libreoffice --headless --invisible --convert-to pdf:writer_pdf_Export " + filePath + fileName + outDir;
        }

        exitStatus = executeOSCommand(command);
        return exitStatus;
    }

    /**
     * 调用操作系统的控制台,执行 command 指令
     * 执行该方法时,并没有等到指令执行完毕才返回,而是执行之后立即返回,返回结果为 0,只能说明正确的调用了操作系统的控制台指令,但执行结果如何,是否有异常,在这里是不能体现的,所以,更好的姿势是用同步转换功能。
     */
    private static int executeOSCommand(String command) throws Exception {
        Process process;
        process = Runtime.getRuntime().exec(command); // 转换需要时间,比如一个 3M 左右的文档大概需要 8 秒左右,但实际测试时,并不会等转换结束才执行下一行代码,而是把执行指令发送出去后就立即执行下一行代码了。

        int exitStatus = process.waitFor();

        if (exitStatus == 0) {
            exitStatus = process.exitValue();
        }

        // 销毁子进程
        process.destroy();
        return exitStatus;
    }
}

OfficeManagerInstance(仅同步方式需要)

import org.jodconverter.office.LocalOfficeManager;
import org.jodconverter.office.OfficeManager;
import org.springframework.beans.factory.annotation.Value;
import org.springframework.stereotype.Component;

import javax.annotation.PostConstruct;

@Component
public class OfficeManagerInstance {
    private static OfficeManager INSTANCE = null;

    @Value("${libreOffice.prilibreOfficeHome}")
    private String prilibreOfficeHome;
    @Value("${libreOffice.portNumbers}")
    private String portNumbers;
    @Value("${libreOffice.taskExecutionTimeoutMinutes}")
    private String taskExecutionTimeoutMinutes;
    @Value("${libreOffice.taskQueueTimeoutHours}")
    private String taskQueueTimeoutHours;

    public static synchronized void start() {
        officeManagerStart();
    }

    @PostConstruct
    private void init() {
        try {
            String[] portNum = portNumbers.split(",");
            int[] ports = new int[portNum.length];
            for (int i = 0; i < portNum.length; i++) {
                ports[i] = Integer.parseInt(portNum[i]);
            }
            LocalOfficeManager.Builder builder = LocalOfficeManager.builder().install();
            builder.officeHome(prilibreOfficeHome);
            builder.portNumbers(ports);
            builder.taskExecutionTimeout(Integer.parseInt(taskExecutionTimeoutMinutes) * 1000 * 60); // minute
            builder.taskQueueTimeout(Integer.parseInt(taskQueueTimeoutHours) * 1000 * 60 * 60); // hour
            INSTANCE = builder.build();
            officeManagerStart();
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

    private static void officeManagerStart() {
        if (INSTANCE.isRunning()) {
            return;
        }

        try {
            INSTANCE.start();
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

CentOS 7.5 / 7.6 / 7.7安装libreoffice 5.3.6.1过程方法arm

---目前CentOS 7.5、7.6和7.7的arm版本都自带libreoffice 5.3.6.1版本

【安装过程】

1、挂载系统ISO镜像并配置本地yum源(无法访问互联网时需要执行此步骤,可以访问互联网直接跳过)

挂载OS镜像:mount -o loop /home/CentOS-7-aarch64-Everything-1810.iso   /mnt/CentOS/

修改/etc/yum.repos.d/CentOS-Base.repo文件,配置yum本地源:

[base]

name=CentOS-$releasever   - Base

#mirrorlist=http://mirrorlist.centos.org/?release=$releasever&arch=$basearch&repo=os&infra=$infra

baseurl=   file:///mnt/CentOS

gpgcheck=1

gpgkey=   file:///mnt/CentOS/RPM-GPG-KEY-CentOS-7

file:///mnt/CentOS/RPM-GPG-KEY-CentOS-7-aarch64

运行下面的命令,使yum源配置生效:

yum clean all

yum makecache

yum安装GCC等相关依赖:

sudo yum install -y snappy snappy-devel autoconf automake libtool   git gcc gcc-c++ make cmake openssl openssl-devel ncurses-devel zlib   zlib-devel bzip2 bzip2-devel bzip2-libs readline readline-devel bison zip   unzip tar tcl java-1.8.0* bison* ncurses*

2、执行yum命令直接安装

yum -y install libreoffice*

3、查看libreoffice版本及帮助信息

libreoffice --version

Java 利用LibreOffice将Office文档转换成 PDF,进而转图片,实现在线预览功能

 

上一篇:极速office(Word)怎么修改纸张方向


下一篇:(专升本)Office应用程序