Python并发复习1 - 多线程

一、基本概念

程序: 指令集,静态,

进程: 当程序运行时,会创建进程,是操作系统资源分配的基本单位

线程: 进程的基本执行单元,每个进程至少包含一个线程,是任务调度和执行的基本单位

> 进程和线程之间的关系:

① 一个线程只属于一个进程
② 一个进程可以包含多个线程,只有一个主线程

>  进程和线程资源对比

① 进程具有独立的空间和系统资源

② 线程不具有独立的空间和系统资源

③ 同一个进程下的多个线程共享该进程的空间和系统资源

④ 局部变量不共享

> 多线程中对于贡献资源修改的问题 
--- 多线程的同步问题、 线程不安全、通过同步解决

二、 多线程

1.需要清楚的一点

  单核CPU: 宏观并行,微观实际上是串行 - 并发
  多核CPU: 微观本质并行

2.应用场合:  

  ① 计算密集型  --- 不适合单核CPU多线程  --- 数值计算
  ② I/O密集型  --- 适合单核CPU多线程   --- 频繁读写

3.优点:

   速度快

4.缺点:

  (1) 线程本身也是程序,线程越多,占用的内存越多;
  (2) 多线程的调用需要协调管理,CPU对线程的跟踪需要消耗内存;
  (3) CPU多线程的切换需要消耗内存
  (4) 多线程之间对共享资源问题,需要解决数据的一致性

三、 线程的创建

三种方式:

(1) threading模块
--- 通过指定target(函数名)和args(函数参数)
(2) 使用Thread类,重写run方法
(3) 使用线程池

3.1 threading模块

 import threading
import time
def misson(*args):
for i in range(args[1]):
print(i)
time.sleep(1)
# 创建线程对象,参数必须使用元组传递
t = threading.Thread(target = mission, args = args)
# 激活线程(排队),等待CPU分配时间片来执行
t.start()
t.start()

3.2. 使用Thread类,重写run方法

--- 适用于需要创建很多个执行方法相同的线程对象时,用类方法

 class My_Thread(threading.Thread):
def __init__(self, n1):
self.n1 = n1
super().__init__()
# run方法是真正执行函数认为的方法
def run(self):
for i in range(self.end):
print(i)
t1 = My_Thread()
t1.start(10)

3.3 线程池

线程池的使用threadpool较少,使用concurrent.futures下的 ThreadPoolExecutor 线程池

 from concurrent.futures import ThreadPoolExecutor
import time def sayhello(a):
print("hello: " + a)
time.sleep(2) def main():
seed = ["a", "b", "c"] # 第一种方法submit
with ThreadPoolExecutor(3) as executor:
for each in seed:
executor.submit(sayhello, each) # 第二种方法map
with ThreadPoolExecutor(3) as executor1:
executor1.map(sayhello, seed) if __name__ == '__main__':
main()

四、 线程的生命周期

(1) 新建 --- 创建线程对象,没有执行能力
(2) 就绪 --- 调用start方法,把执行权利交给CPU
(3) 运行 --- 执行线程任务,获得CPU时间片在一个线程运行时,可能将时间片分配给其他线程
(4) 阻塞 --- 处于等待过程,CPU不给阻塞状态分配时间片
(5) 死亡 --- run方法执行完毕或者抛出没有捕获的异常

五、线程的同步

  --- 在同一个进程下,各个线程共享资源引起不安全,即对成员变量的操作进行共享

1.  抢票问题 - 锁

 import time
import threading ticket = 100 def buy_ticket():
global ticket
while ticket:
t = threading.current_thread()
print(f'{t.name}{ticket}')
time.sleep(0.5)
ticket -= 1 if __name__ == '__main__':
t1 = threading.Thread(target=buy_ticket)
t1.name = '张三' # 设定线程名字
t1.start()
t2 = threading.Thread(target=buy_ticket)
t2.name = '张四'
t2.start()
t3 = threading.Thread(target=buy_ticket)
t3.name = '张五'
t3.start()

运行结果如下,会出现重复的抢票,即多个线程获得同一个变量:

Python并发复习1 - 多线程

解决办法:

使用线程锁, 即在同一时间内,一个共享资源只能被一个线程访问

加锁      --- threading.Lock()
抢锁     --- lock.acquare()
解锁     --- lock.release()

 import time
import threading lock = threading.Lock()
ticket = 100
def buy_ticket():
global ticket
while True:
try:
lock.acquire()
if ticket > 0:
t = threading.current_thread()
time.sleep(0.2)
print(f'{t.name}抢到了第{ticket}张票')
ticket -= 1
else:
break
finally:
lock.release() t1=threading.Thread(target=buy_ticket)
t1.name="张三"
t2=threading.Thread(target=buy_ticket)
t2.name="李四"
t3=threading.Thread(target=buy_ticket)
t3.name="王五" t1.start()
t2.start()
t3.start()

2. 生产者消费者模型

(1)  消费者一直消费,商品=0,等待生产                    --- wait 
   (2)  生产者隔一段时间看一次,如果小于3,开始生产 --- 耗费CPU
   (3)  只要消费者消费了产品,通知生产者生产商品       --- notify

程序见Python并发复习2 - threading模块

六、多进程

1. 进程创建

(1)使用multiprocessing.Process(target=函数名)

(2)继承Process重写run

2.
进程操作

Os.getpid      # 得到本身进程id

Os.getppid    # 得到父进程id

Fork:复制进程,只能在linux下使用

其他方法同线程

3.
进程队列

进程优于线程:

不存在资源共享问题,没有同步锁,也没有死锁

多进程需要处理资源共享问题,使用队列序列化处理(进程队列已经处理好)

程序见Python并发复习2 - threading模块

上一篇:Linux 命令行操作和文件管理


下一篇:NOIP2016题目整合