PymuPDF实现PDF文字和图片的修改

实现了PymuPDF替换pdf指定位置文字和图片的功能,并分别保存pdf和JPG格式.

#-*- coding:utf-8 -*-
import os
import PyPDF2 
import fitz

text = u"湖南省湘潭市雨湖区鹤岭镇长安村永红组"


file_path = r'D:\Desktop\新建文件夹'

for root,dirs,files in os.walk(file_path):
	for file in files:
		print(file)
		if file.upper().endswith('FWT.PDF'):
			print(file.upper())
			pdfPath=os.path.join(root,file)
			print(pdfPath)
			doc = fitz.open(pdfPath)
			page=doc[0]
			#方法1插入一个空白图片或者直接插入带文字的图片(效果有出入)
			# rect=fitz.Rect(1050,-4260,2600,-4150) #替换坐落为空白区域--需要调试位置,
			# pix=fitz.Pixmap(r"D:\t.jpg")
			# page.insert_image(rect,pixmap=pix,overlay=True)
			#方法2插入空白区域,再插入文本
			
			page.draw_rect((1050,-4255,2600,-4150),color=(1,1,1),fill=(1,1,1),width=0) #方法1绘制白色无框矩形覆盖地址
			#方法1,定义字体文件会比直接调用PDF体积小一些  fontname="SimHei" ,fontfile=r"C:\Windows\Fonts\simhei.ttf"
			ff=page.insert_font(fontname="HT",fontfile=r"C:\Windows\Fonts\simhei.ttf", fontbuffer=None , set_simple=False ) #定义黑体
			page.insert_text((1150,-4190),text,fontname="HT" ,fontsize=86 ,color=(0,0,0,1), fill=None, render_mode=0, border_width=1, rotate=0, morph=None, overlay=True)
			#方法2:定义CJK内置字体,默认china-s默认为黑体,但是在非福昕阅读器当中显示有异常,直接导出JPG也显示有异常(弃用)
			#page.insert_text((1150,-4190),text,fontname="china-t" ,fontsize=86 ,color=(0,0,0,1), fill=None, render_mode=0, border_width=1, rotate=0, morph=None, overlay=True)
			#https://pymupdf.readthedocs.io/en/latest/page.html#Page.insert_font 参照 CJK内置字体china-s 黑体 china-ss 宋体 china-t 繁体黑体 china-ts 繁体宋体
			print('导出:',r"D:\Desktop\新建文件夹\2_1.PDF" )
			#print('导出:',os.path.splitext(pdfPath)[0]+"_1.PDF" )
			doc.save(r"D:\Desktop\新建文件夹\2_1.PDF",garbage=4, deflate=True)
			


			#PDF导出图片-并提升导出图片分辨率2倍
			zoom_x = 2.0 
			zomm_y = 2.0 m
			mat = fitz.Matrix(zoom_x, zomm_y) 
			pix = page.get_pixmap(matrix=mat,alpha=0) # alpha=0 白色背景
			pix.save(r"D:\Desktop\新建文件夹\2_1.JPG") #直接保存成jpg 不处理,清晰度低

上一篇:PymuPDF实现PDF文字和图片的修改


下一篇:linux系统下的网络测速speedtest