文章目录
Python合并多份pdf文件为一份
PyPDF2库说明
PyPDF2官方文档
PyPDF2库可以很方便的处理 pdf 文件,提供读,割,合并,文件转换等多种pdf文件操作。
PDF文件合并思路:
- step1:
os.listdir
方法(函数)获取指定路径目录下所有pdf文件名称 - step2:
.path.join
方法拼接成绝对路径 - step3:创建PdfFileMerger对象,这是专门用来合并pdf文件的对象
- step4:
append()
将所有文件 - step5:最后,使用
write()
方法(函数)将所有pdf文件写入到一个文件
PyPDF2库安装
pip install PyPDF2 -i https://pypi.tuna.tsinghua.edu.cn/simple
示例代码
import os
from PyPDF2 import PdfFileMerger
# 定义即将读取的指定PDF文件路径,注意文件的顺序,正斜杠/
target_path = 'C:/Users/zero/JupyterProject/data/tempPDF'
pdf_lst = [f for f in os.listdir(target_path) if f.endswith('.pdf')]
pdf_lst = [os.path.join(target_path, filename) for filename in pdf_lst]
# 合并pdf文件
file_merger = PdfFileMerger()
for pdf in pdf_lst:
file_merger.append(pdf)
# 合并pdf文件,并输出到指定路径
file_merger.write("D:/zero/Desktop/OutputMerge.pdf")