一, 进程,线程?
进程是具有一定独立功能的,在计算机中已经运行的程序的实体。在linux2.4以前,进程是基本运作的单位,在只是线程的系统中,线程才是最基本的运作单位,而进程只是线程的容器,程序本身只是指令,数据及其组织形式的描述,进程才是程序的真正运行实例。若干进程有可能在同一程序相关,且每个进程皆可以同步或异步的方式独立运行。现代计算机系统可在同一时间内以进程的形式将多个程序加载到储存器中,并借由时间共享,以在一个处理器上表现出同时运行的感觉,同样的,使用多线程技术(每一个线程都代表一个进程内的一个独立执行上下文)的操作系统或计算机架构,同样程序的平行线程,可在多cpu主机或网络上真正同时运行。
二, 常见Web服务方式
-
一个web请求处理的过程:
(1),用户发起请求到服务器网卡;
(2),服务器网卡接收到请求后,转交给内核处理;
(3),内核根据请求对应的套接字,将请求交给工作在用户控件的web服务器进程;
(4),Web服务器进程根据用户请求,向内核进行系统调用,申请获取相应的资源;
(5),内核发现web服务器进程请求的是一个放存在硬盘上的资源,因此通过驱动程序连接磁盘;
(6),内核调度磁盘,获取需要的资源;
(7),内核将资源存放在自己的缓冲区中,并通知web服务器进程;
(8),web服务器进程通过系统调用取得资源,并将其复制到进程自己的缓冲区中;
(9),web服务器进程形成响应,通过系统调用再次发给内核以响应自己用户请求;
(10),内核将响应发给网卡;
(11),网卡发送响应给用户;
简单来说:用户请求—>送达用户空间—>系统调用—>内核空间—>内核到磁盘上读取网页的资源—>返回到用户空间—>响应给用户。
2.三种工作模型比较:
多进程方式:为每个请求启动一个进程来处理,由于在操作系统中,生成进程,销毁进程,进程间切换都很耗费CPU和内存,当负载高时,性能会明显降低。
优点:稳定性!由于采用独立进程处理地理请求,而进程之间是独立的,单个进程问题不会影响其他进程,因此稳定性是最好的
缺点:占用资源!当请求过大时,需要大量的进程处理请求,进程生成,切换开销很大,而且进程间资源是独立的,造成内存重复利用。
多线程方式:一个进程中用多个线程处理用户请求,由于线程开销明显小于进程,而且部分资源还可以共享,因此效率较高。
优点:开销较小!线程部分数据是共享的,且线程生成与线程间的切换所需要的资源开销比进程间切换小的多
缺点:稳定性!线程切换过快可能造成线程抖动,且线程过多会造成服务器不稳定。
异步方式:使用非阻塞方式处理请求,是三种方式中开销最小的,但异步方式虽然效率高,但要求也高,因为多任务之间的调度如果出现故障,就可能出现整体故障,因此使用异步工作的,一般是一些功能相对简单,但却符合服务器任务调度,且代码中没有影响调度的错误代码存在的程序。
优点:性能最好!一个进程或线程处理多个请求,不需要额外开销,性能最好,资源占用最低。
缺点:稳定性!某个进程或线程出错,可能导致大量请求无法处理,甚至导致整个服务器宕机。
三, 各种I/O模型详解
通过一的连接分析,我们知道工作在用户空间的web服务器进程是无法直接操作I/O的,需要通过系统调用进行。
进程向内核进行系统调用申请I/O,内核将资源从IO调度到内核的buffer中(wait阶段),内核还需将数据从内核buffer中复制(copy阶段)到web服务器进程所在的用户空间,才算完成一次IO调度,这几个阶段都是需要时间的,根据wait和copy阶段的处理等待机制不同,可将I/O动作分为如下五中模式:
阻塞I/O:所有过程全阻塞
非阻塞I/O:如果没有数据buffer,则立即返回
I/O复用(select和poll):在wait和copy阶段分别阻塞(select和poll)
信号驱动I/O:在wait阶段不阻塞,但在copy阶段阻塞(信号驱动I/O,既通知)
异步I/O:完全无阻塞方式每当I/O完成时提供信号
阻塞和非阻塞:
阻塞和非阻塞指的是执行一个操作是等操作结束再返回,还是马上返回。
阻塞:在出菜窗口等待,直到厨师炒完菜后将菜送到窗口,然后服务员再将菜送到用户手中
非阻塞:等一会再到窗口来问厨师,某个菜好了没,如果没有就先处理其他事情,等会再去问一次;
同步和异步:
同步和异步是另外一个概念,它是事件本身的一个属性。
服务员直接和厨师打交道,菜出来没出来,服务员直接指导,但只有当厨师将菜送到服务员手上这个过程才算正常完成,这就是同步事件,同步只能以阻塞的方式去做。
有些餐馆有专门的传菜人员,当厨师炒好菜后,传菜员将菜送到传菜窗口,并通知服务员,这就变成异步了。异步也可以分为两种:带通知的和不带通知的。前面说的属于带通知的,有些传菜员可能干活主动性不是很够,不会主动通知你,你需要时不时关注一下状态,这就是不带通知的异步。异步 阻塞和非阻塞都是可以。非阻塞又分为两种方式:主动查询和被动接收消息,被动的效率更高,因为主动查询里绝大部分的查询是在做无用功
全异步I/O:
回到I/O,不管是I还是O,对外设(磁盘)的访问都可以分为请求和执行两个阶段,请求就是看外设的状态信息,执行才是真正的I/O操作