小技巧 | 用python给敏感信息加水印

小技巧 | 用python给敏感信息加水印

加水印,大家对这个都不陌生,但是很多人都懒的加,大多数人都觉得没必要。但是对于类似于身份证这些敏感信息,个人建议还是打一下水印,虽然对于现在的技术来说,消水印也是分分钟的事情,但是打还是比不打好!

市面上很多打水印的软件,有免费的,有收费的,免费的大部分是网页版,需要将这些信息上传,虽然很多网站都写着,绝对不会保存用户信息,懂的人都知道,这是掩耳盗铃,收费的类似于WPS,需要开会员才能使用其功能。

那对于像我这种不想上传到别人的网站,使用频率不高,开会员也不划算的人来说,还是写个小脚本来做这个事情。下面附上代码,代码很短,使用也很简单。
import os
from PyPDF2 import PdfFileWriter, PdfFileReader
from reportlab.pdfgen import canvas
from reportlab.lib.units import cm
from reportlab.pdfbase import pdfmetrics
from reportlab.pdfbase.ttfonts import TTFont

# 文件保存目录
BASE_DIR = 'E:\\pdf'

# 添加中文字体
font_dir = os.path.join(BASE_DIR, "msyh.ttc")
pdfmetrics.registerFont(TTFont('msyh', font_dir))

def create_watermark(content):  
    """创建PDF水印模板 
    """  
    watermark_pdf = os.path.join(BASE_DIR, 'watermark.pdf')
    # 使用reportlab来创建一个PDF文件来作为一个水印文件   
    c = canvas.Canvas(watermark_pdf, pagesize= (30*cm, 30*cm))  
    c.translate(10*cm, 5*cm) 
    # 设置字体
    c.setFont('msyh', 80)

    # 设置水印文件  
    c.saveState()   
    c.translate(300, 15)   
    # 设置不透明度
    c.setFillAlpha(0.3)
    # 旋转45度
    c.rotate(45)
    # 水印文字  
    c.drawString(-10*cm, 0*cm, content)
    c.drawString(-10*cm, 6*cm, content)
    c.drawString(-10*cm, 12*cm, content)
    c.drawString(-10*cm, 18*cm, content)
    c.restoreState()   
    # 保存水印文件  
    c.save()  
    pdf_watermark = PdfFileReader(open(watermark_pdf, "rb"))
    return pdf_watermark

#所有路径为绝对路径
def add_watermark(pdf_file_in, pdf_file_mark, pdf_file_out):
    pdf_output = PdfFileWriter()
    input_stream = open(pdf_file_in, 'rb')
    pdf_input = PdfFileReader(input_stream)

    # 获取PDF文件的页数
    pageNum = pdf_input.getNumPages()
    #读入水印pdf文件
    pdf_watermark = pdf_file_mark
    # 给每一页打水印
    for i in range(pageNum):
        page = pdf_input.getPage(i)
        page.mergePage(pdf_watermark.getPage(0))
        page.compressContentStreams()   #压缩内容
        pdf_output.addPage(page)
    pdf_output.write(open(pdf_file_out, 'wb'))

if __name__ == "__main__":
    # 创建水印
    pdf_file_mark = create_watermark("个人证件禁止商业用途")
    # 需要打水印的pdf
    pdf_file_in = os.path.join(BASE_DIR, "身份证.pdf")
    # 打完水印后的文件
    pdf_file_out = os.path.join(BASE_DIR, "水印身份证.pdf")
    add_watermark(pdf_file_in, pdf_file_mark, pdf_file_out)

使用方法:

(1)、pdf_file_mark = create_watermark("个人证件禁止商业用途"),将需要打的水印文字替换即可;

(2)、pdf_file_in = os.path.join(BASE_DIR, "身份证.pdf"),需要打水印的文件,将这些图片信息保存为PDF文件;

(3)、pdf_file_out = os.path.join(BASE_DIR, "水印身份证.pdf"),打完水印后的文件;

示例:

打水印前的图片如下:

小技巧 | 用python给敏感信息加水印

打完水印之后如下:

小技巧 | 用python给敏感信息加水印

操作是不是很简单?希望对你有用!

上一篇:我的数据访问函数库的源代码(二)—— SQL语句部分


下一篇:CSP中的选择