一、多进程
1. 进程的创建步骤
- 导入进程包
import multiprocessing
- 通过进程类创建进程对象sub_process
sub_process = multiprocessing.Process(target=任务名)
参数名 | 说明 |
---|---|
target | 执行的目标任务名,这里指函数名(方法名) |
name | 进程名,一般不用设置 |
group | 进程组,目前只能使用None |
- 启动进程执行任务
sub_process.start()
"""
1. 导入进程包
import multiprocessing
2. 通过进程类创建进程对象
sub_process = multiprocessing.Process()
3. 启动进程执行任务
sub_process.start()
"""
import multiprocessing
import time
def sing():
for i in range(3):
print("sing")
time.sleep(0.5)
def dance():
for i in range(3):
print("dance")
time.sleep(0.5)
if __name__ == '__main__':
# 创建子进程sing
sing_process = multiprocessing.Process(target=sing)
# 创建子进程dance
dance_process = multiprocessing.Process(target=dance)
# 启动进程
sing_process.start()
dance_process.start()
2. 进程执行带有参数的任务
参数名 | 说明 |
---|---|
args | 以元组的形式传参 |
kwargs | 以字典的形式传参 |
if __name__ == '__main__':
# args: 元组形式传参
sing_process = multiprocessing.Process(target=sing, args=(3,))
# kwargs: 字典形式传参
dance_process = multiprocessing.Process(target=dance, kwargs={"num": 3})
sing_process.start()
dance_process.start()
3. 获取进程编号
- 获取当前进程编号
os.getpid()
- 获取当前父进程编号
os.getppid()
import os
pid = os.getpid()
print(pid)
import multiprocessing
import time
import os
def sing(num, name):
print("sing - current process id", os.getpid())
print("sing - parent's process id", os.getppid())
for i in range(num):
print(name)
print("sing...")
time.sleep(0.5)
def dance(num, name):
print("dance - current process id", os.getpid())
print("dance - the parent's process id", os.getppid())
for i in range(num):
print(name)
print("dance...")
time.sleep(0.5)
if __name__ == '__main__':
sing_process = multiprocessing.Process(target=sing, args=(3, "mateo"))
dance_process = multiprocessing.Process(target=dance, kwargs={"num": 3, "name": "*"})
sing_process.start()
dance_process.start()
4. 进程的注意点
- 主进程默认会等待所有的子进程执行结束再结束
- 设置守护主进程,主进程结束则子进程强制结束
sub_process.daemon = True
5. 进程状态
- 判断进程是否正在运行:
p.is_alive()
- 等待进程结束:
p.join()
6. 案例-视频文件夹高并发copy器(多进程)
import multiprocessing
import os
import time
def copy_file(filename, source_dir, destination_dir):
# 1. 拼接源文件路径和目标文件路径
source_path = source_dir + "/" + filename
destination_path = destination_dir + "/" + filename
# 2. 打开源文件和目标文件
with open(source_path, "rb") as source_file:
with open(destination_path, "wb") as destination_file:
# 3. 循环读取源文件到目标路径
while True:
data = source_file.read(1024)
if data:
destination_file.write(data)
else:
break
if __name__ == '__main__':
# 1. 定义源文件夹和目标文件夹
source_dir = r"D:\python\cs61a\resources\tutorials video"
destination_dir = "videos"
# 2. 创建目标文件夹
try:
os.mkdir(destination_dir)
except OSError:
print("folder exists")
# 3. 读取源文件夹的文件列表
file_list = os.listdir(source_dir)
# 开始时间
start_time = time.perf_counter()
# 4. 遍历文件列表实现拷贝
sub_processes = []
for filename in file_list:
# copy_file(filename, source_dir, destination_dir)
# 5. 使用多进程实现多任务拷贝
sub_process = multiprocessing.Process(target=copy_file,
args=(filename, source_dir, destination_dir))
sub_process.start()
sub_processes.append(sub_process)
# 结束时间
for sub_process in sub_processes:
sub_process.join()
end_time = time.perf_counter()
print("并发使用时间:", end_time - start_time)
结果1: 并发使用时间: 1.0547636 s, 单线程使用时间: 1.2491160000000001 s
结果2: 并发使用时间: 0.8891155999999999 s, 单线程使用时间: 1.1450036 s
二、多线程
多线程是python程序中实现多任务的一种方式。
线程是程序执行的最小单位。
同属一个进程的多个线程共享进程所拥有的全部资源。
1. 线程的创建步骤
- 导入线程模块
import threading
- 通过线程类创建进程对象sub_process
sub_thread = threading.Thread(target=任务名)
参数名 | 说明 |
---|---|
target | 执行的目标任务名,这里指函数名(方法名) |
name | 线程名,一般不用设置 |
group | 线程组,目前只能使用None |
- 启动线程执行任务
sub_thread.start()
"""
1. 导入线程模块
import threading
2. 通过线程类创建进程对象sub_process
sub_thread = threading.Thread(target=任务名)
3. 启动线程并执行任务
sub_thread.start()
"""
import time
import threading
def sing():
for i in range(3):
print("sing...")
time.sleep(1)
def dance():
for i in range(3):
print("dance...")
time.sleep(1)
if __name__ == '__main__':
sing_thread = threading.Thread(target=sing)
dance_thread = threading.Thread(target=dance)
sing_thread.start()
dance_thread.start()
2. 线程执行带有参数的任务
参数名 | 说明 |
---|---|
args | 以元组的形式传参 |
kwargs | 以字典的形式传参 |
if __name__ == '__main__':
# args: 元组形式传参
sing_thread = threading.Thread(target=sing, args=(3,))
# kwargs: 字典形式传参
dance_thread = threading.Thread(target=dance, kwargs={"num": 3})
sing_thread.start()
dance_thread.start()
3. 主线程与子线程的结束顺序
-
主线程默认会等待所有的子线程执行结束再结束
-
设置守护主线程,主线程结束则子线程强制结束
# 设置守护主进程方式 1 work_thread = threading.Thread(target=work, daemon=True) # 设置守护主进程方式 2 # work_thread.setDaemon(True)
4. 线程间的执行顺序
- 线程间执行是无序的,由CPU调度决定。
- 获取当前的线程信息
threading.current_thread()
import time
import threading
def task():
time.sleep(1)
# current_thread 获取当前线程的线程对象
thread = threading.current_thread()
print(thread)
if __name__ == '__main__':
for i in range(5):
sub_thread = threading.Thread(target=task)
sub_thread.start()
5. 进程和线程对比
关系对比
- 线程依附在进程中,没有进程就没有线程
- 一个进程默认提供一条线程,进程可以创建多个线程
区别对比
- 创建进程的资源开销比创建线程开销更大
- 进程是操作系统资源分配的基本单位,线程是CPU调度的基本单位
- 线程不能独立执行
优缺点对比
- 进程可以用多核,但资源开销大
- 线程资源开销小,但不能使用多核
6. 案例-视频文件夹高并发copy器(多线程)
import threading
import os
import time
def copy_file(filename, source_dir, destination_dir):
# 1. 拼接源文件路径和目标文件路径
source_path = source_dir + "/" + filename
destination_path = destination_dir + "/" + filename
# 2. 打开源文件和目标文件
with open(source_path, "rb") as source_file:
with open(destination_path, "wb") as destination_file:
# 3. 循环读取源文件到目标路径
while True:
data = source_file.read(1024)
if data:
destination_file.write(data)
else:
break
if __name__ == '__main__':
# 1. 定义源文件夹和目标文件夹
source_dir = r"D:\python\cs61a\resources\tutorials video"
destination_dir = "videos"
# 2. 创建目标文件夹
try:
os.mkdir(destination_dir)
except OSError:
print("folder exists")
# 3. 读取源文件夹的文件列表
file_list = os.listdir(source_dir)
# 开始时间
start_time = time.perf_counter()
# 4. 遍历文件列表实现拷贝
sub_threads = []
for filename in file_list:
# copy_file(filename, source_dir, destination_dir)
# 5. 使用多进程实现多任务拷贝
sub_thread = threading.Thread(target=copy_file,
args=(filename, source_dir, destination_dir))
sub_thread.start()
sub_threads.append(sub_thread)
# 结束时间
for sub_thread in sub_threads:
sub_thread.join()
end_time = time.perf_counter()
print("并发使用时间:", end_time - start_time, "s")
结果1: 并发使用时间: 0.6955842 s
结果2: 并发使用时间: 0.5768514 s
主要参考:黑马程序员