室友的Zip加密文件探秘,Python解决Zip加密文件探索秘密!

室友的Zip加密文件探秘,Python解决Zip加密文件探索秘密!

之前在家里的老电脑中,发现一个加密zip压缩包,由于时隔太久忘记密码了,依稀记得密码是6位字母加数字,网上下载了很多破解密码的软件都没有效果,于是想到自己用Python写一个暴力破解密码的脚本。

Python有一个内置模块zipfile可以干这个事情,测试一波,一个测试文件,设置解压密码为123。

很多人学习python,不知道从何学起。
很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手。
很多已经做案例的人,却不知道如何去学习更加高深的知识。
那么针对这三类人,我给大家提供一个好的学习平台,免费领取视频教程,电子书籍,以及课程的源代码!??¤
QQ群:232030553

室友的Zip加密文件探秘,Python解决Zip加密文件探索秘密!

import zipfile  
# 创建文件句柄  
file = zipfile.ZipFile("测试.zip", 'r')  
# 提取压缩文件中的内容,注意密码必须是bytes格式,path表示提取到哪  
file.extractall(path='.', pwd='123'.encode('utf-8')) 

运行效果如下图所示,提取成功。

室友的Zip加密文件探秘,Python解决Zip加密文件探索秘密!

好了开始破解老文件的密码,为了提高速度我加了多线程最初的代码:

import zipfile  
import itertools  
from concurrent.futures import ThreadPoolExecutor  
def extract(file, password):  
    if not flag: return  
    file.extractall(path='.', pwd=''.join(password).encode('utf-8'))  
def result(f):  
    exception = f.exception()  
    if not exception:  
        # 如果获取不到异常说明破解成功  
        print('密码为:', f.pwd)  
        global flag  
        flag = False  
if __name__ == '__main__':  
    # 创建一个标志用于判断密码是否破解成功  
    flag = True  
    # 创建一个线程池  
    pool = ThreadPoolExecutor(100)  
    nums = [str(i) for i in range(10)]  
    chrs = [chr(i) for i in range(65, 91)]  
    # 生成数字+字母的6位数密码  
    password_lst = itertools.permutations(nums + chrs, 6)  
    # 创建文件句柄  
    zfile = zipfile.ZipFile("加密文件.zip", 'r')  
    for pwd in password_lst:  
        if not flag: break  
        f = pool.submit(extract, zfile, pwd)  
        f.pwd = pwd  
        f.pool = pool  
        f.add_done_callback(result) 

这个代码有个问题,跑一会儿内存就爆了!原因:ThreadPoolExecutor默认使用的是*队列,尝试密码的速度跟不上生产密码的速度,会把生产任务无限添加到队列中。导致内存被占满。内存直接飙到95:

室友的Zip加密文件探秘,Python解决Zip加密文件探索秘密!

然后程序奔溃:

室友的Zip加密文件探秘,Python解决Zip加密文件探索秘密!

看了一下源码发现ThreadPoolExecutor内部使用的是*队列,所以导致内存直接飙满,重写ThreadPoolExecutor类中的_work_queue属性,将*队列改成有界队列,这样就不会出现内存爆满的问题,看代码:

import queue  
from concurrent.futures import ThreadPoolExecutor  
class BoundedThreadPoolExecutor(ThreadPoolExecutor):  
    def __init__(self, max_workers=None, thread_name_prefix=''):  
        super().__init__(max_workers, thread_name_prefix)  
        self._work_queue = queue.Queue(self._max_workers * 2) # 设置队列大小 

最后破解成功,如下图所示。

室友的Zip加密文件探秘,Python解决Zip加密文件探索秘密!

上一篇:java线程池


下一篇:Java线程池实现原理及其在美团业务中的实践