29. 线程

线程理论

  • 什么是线程

    """
    	进程:资源单位(起一个进程仅仅只是在内存空间中开辟一块独立的空间)
    	线程:执行单位(真正被cpu执行的其实是进程里面的线程,线程指的就是代码的执行过程,执行代码中所需要使用到的资源都找所在的进程索要)
        如果将操作系统比喻成一个大的工厂,那么进程就相当于工厂里面的车间,而线程就是车间里面的流水线,每一个进程默认自带一个线程	
    进程和线程都是虚拟单位,只是为了更加方便的描述问题
    """
    
  • 为何要有线程

    """
    开进程
    	1.申请内存空间,耗资源
    	2.“拷贝代码” ,耗资源
    开线程
    	一个进程内可以开设多个线程,在用一个进程内开设多个线程无需再次申请内存空间操作
    总结:
    	开设线程的开销要远远的小于进程的开销
    	同一个进程下的多个线程数据是共享的
    """
    
  • 开设线程的两种方式

    # 第一种方式
    from multiprocessing import Process
    from threading import Thread
    import time
    
    def task(name):
        print('%s is running'%name)
        time.sleep(1)
        print('%s is over'%name)
    # 开启线程不需要在main下面执行代码 直接书写就可以
    # 但是我们还是习惯性的将启动命令写在main下面
    t = Thread(target=task,args=('egon',))
    p = Process(target=task,args=('jason',))
    p.start()
    t.start()  # 创建线程的开销非常小 几乎是代码一执行线程就已经创建了
    print('主')
    
    # 第二种方式
    from threading import Thread
    import time
    
    class MyThead(Thread):
        def __init__(self, name):
            """针对刷个下划线开头双下滑线结尾(__init__)的方法 统一读成 双下init"""
            # 重写了别人的方法 又不知道别人的方法里有啥 你就调用父类的方法
            super().__init__()
            self.name = name
    
        def run(self):
            print('%s is running'%self.name)
            time.sleep(1)
            print('egon DSB')
    
    if __name__ == '__main__':
        t = MyThead('egon')
        t.start()
        print('主')
    

    TCP服务端实现并发的效果

    import socket
    from threading import Thread
    from multiprocessing import Process
    """
    服务端
        1.要有固定的IP和PORT
        2.24小时不间断提供服务
        3.能够支持并发
        
    从现在开始要养成一个看源码的习惯
    我们前期要立志称为拷贝忍者 卡卡西 不需要有任何的创新
    等你拷贝到一定程度了 就可以开发自己的思想了
    """
    server =socket.socket()  # 括号内不加参数默认就是TCP协议
    server.bind(('127.0.0.1',8080))
    server.listen(5)
    
    
    # 将服务的代码单独封装成一个函数
    def talk(conn):
        # 通信循环
        while True:
            try:
                data = conn.recv(1024)
                # 针对mac linux 客户端断开链接后
                if len(data) == 0: break
                print(data.decode('utf-8'))
                conn.send(data.upper())
            except ConnectionResetError as e:
                print(e)
                break
        conn.close()
    
    # 链接循环
    while True:
        conn, addr = server.accept()  # 接客
        # 叫其他人来服务客户
        # t = Thread(target=talk,args=(conn,))
        t = Process(target=talk,args=(conn,))
        t.start()
    
    
    """客户端"""
    import socket
    
    
    client = socket.socket()
    client.connect(('127.0.0.1',8080))
    
    while True:
        client.send(b'hello world')
        data = client.recv(1024)
        print(data.decode('utf-8'))
    

    线程对象的join方法

    from threading import Thread
    import time
    
    
    def task(name):
        print('%s is running'%name)
        time.sleep(3)
        print('%s is over'%name)
    
    
    if __name__ == '__main__':
        t = Thread(target=task,args=('egon',))
        t.start()
        t.join()  # 主线程等待子线程运行结束再执行
        print('主')
    

    同一个进程下的多个线程数据是共享的(因为都是在进程创建的内存空间中取数据)

    from threading import Thread
    import time
    
    money = 100
    def task():
        global money
        money = 666
        print(money)
    
    if __name__ == '__main__':
        t = Thread(target=task)
        t.start()
        t.join()
        print(money)
    

    线程对象属性及其他方法

    from threading import Thread, active_count, current_thread
    import os,time
    
    def task(n):
        # print('hello world',os.getpid())
        print('hello world',current_thread().name)
        time.sleep(n)
    
    if __name__ == '__main__':
        t = Thread(target=task,args=(1,))
        t1 = Thread(target=task,args=(2,))
        t.start()
        t1.start()
        t.join()
        print('主',active_count())  # 统计当前正在活跃的线程数
        # print('主',os.getpid())
        # print('主',current_thread().name)  # 获取线程名字
    

    守护线程

    from threading import Thread
    import time
    
    def task(name):
        print('%s is running'%name)
        time.sleep(1)
        print('%s is over'%name)
    
    if __name__ == '__main__':
        t = Thread(target=task,args=('egon',))
        t.daemon = True
        t.start()
        print('主')
    
    """
    主线程运行结束之后不会立刻结束 会等待所有其他非守护线程结束才会结束
    因为主线程的结束意味着所在的进程的结束
    """
    

    线程互斥锁

    from threading import Thread, Lockimport timemoney = 100mutex = Lock()def task():    global money    mutex.acquire()    tmp = money    time.sleep(0.1)    money = tmp - 1    mutex.release()if __name__ == '__main__':    t_list = []    for i in range(100):        t = Thread(target=task)        t.start()        t_list.append(t)    for t in t_list:        t.join()    print(money)
    

    GIL全局解释器锁

    Ps:博客园密码:xiaoyuanqujing@666

    """
    官方描述:
    In CPython, the global interpreter lock, or GIL, is a mutex that prevents multiple 
    native threads from executing Python bytecodes at once. This lock is necessary mainly 
    because CPython’s memory management is not thread-safe. (However, since the GIL 
    exists, other features have grown to depend on the guarantees that it enforces.)
    """
    """
    python解释器其实有多个版本
    	Cpython
    	Jpython
    	Pypypython
    但是普遍使用的都是CPython解释器
    
    在CPython解释器中GIL是一把互斥锁,用来阻止同一个进程下的多个线程的同时执行	
    因为cpython中的内存管理不是线程安全的,如果多个线程同时执行,那么就相当于同一个进程里面的线程是相互共享的了,你可以查看别的线程的数据,甚至修改
    """
    
    """
    重点:
    	1.GIL不是python的特点而是CPython解释器的特点
    	2.GIL是保证解释器级别的数据的安全
    	3.GIL会导致同一个进程下的多个线程的无法同时执行即无法利用多核优势(******)
    	4.针对不同的数据还是需要加不同的锁处理 
    	5.解释型语言的通病:同一个进程下多个线程无法利用多核优势
    """
    

    GIL与普通互斥锁的区别

    from threading import Thread,Lock
    import time
    
    mutex = Lock()
    money = 100
    
    def task():
        global money
        # with mutex:
        #     tmp = money
        #     time.sleep(0.1)
        #     money = tmp -1  # 这是另一种写法,这种就不需要自己释放锁了
        mutex.acquire()
        tmp = money
        time.sleep(0.1)  # 只要你进入IO了 GIL会自动释放
        money = tmp - 1
        mutex.release()
    
    if __name__ == '__main__':
        t_list = []
        for i in range(100):
            t = Thread(target=task)
            t.start()
            t_list.append(t)
        for t in t_list:
            t.join()
        print(money)
    
    

    同一个进程下的多线程无法利用多核优势,是不是就没有用了

    """
    多线程是否有用要看具体情况
    单核:四个任务(IO密集型\计算密集型)
    多核:四个任务(IO密集型\计算密集型)
    IO密集型
    	多线程更加节省资源
    计算密集型
    	多进程更加合理
    多进程多线程都是有用的,并且后面的操作都是多进程加上多线程从而达到效率的最大化
    """
    

    线程模块的使用

    Thread实例对象的方法
      # isAlive(): 返回线程是否活动的。
      # getName(): 返回线程名。
      # setName(): 设置线程名。
    
    threading模块提供的一些方法:
      # threading.currentThread(): 返回当前的线程变量。
      # threading.enumerate(): 返回一个包含正在运行的线程的list。正在运行指线程启动后、结束前,不包括启动前和终止后的线程。
      # threading.activeCount(): 返回正在运行的线程数量,与len(threading.enumerate())有相同的结果。
    
上一篇:10月29日 课堂笔记


下一篇:2021-10-29