今日份Python小应用:PyPDF2,Python合并多份pdf为一份文件

文章目录

Python合并多份pdf文件为一份

PyPDF2库说明

PyPDF2官方文档
PyPDF2库可以很方便的处理 pdf 文件,提供读,割,合并,文件转换等多种pdf文件操作。

PDF文件合并思路:

  • step1:os.listdir方法(函数)获取指定路径目录下所有pdf文件名称
  • step2:.path.join方法拼接成绝对路径
  • step3:创建PdfFileMerger对象,这是专门用来合并pdf文件的对象
  • step4:append()将所有文件
  • step5:最后,使用write()方法(函数)将所有pdf文件写入到一个文件

PyPDF2库安装

pip install PyPDF2 -i https://pypi.tuna.tsinghua.edu.cn/simple

示例代码

import os
from PyPDF2 import PdfFileMerger

# 定义即将读取的指定PDF文件路径,注意文件的顺序,正斜杠/
target_path = 'C:/Users/zero/JupyterProject/data/tempPDF'

pdf_lst = [f for f in os.listdir(target_path) if f.endswith('.pdf')]
pdf_lst = [os.path.join(target_path, filename) for filename in pdf_lst]

# 合并pdf文件
file_merger = PdfFileMerger()
for pdf in pdf_lst:
    file_merger.append(pdf)     

# 合并pdf文件,并输出到指定路径
file_merger.write("D:/zero/Desktop/OutputMerge.pdf") 
上一篇:py09(字典)


下一篇:Mongodb脚本记录