Gunicorn

2023-12-16 17:20:15

什么是Gunicorn？

Gunicorn，是一个针对Python的、在Unix系统上运行的、用来解析HTTP请求的网关服务。
它的特点是：能和大多数的Python web框架兼容；使用简单；轻量级的资源消耗；高性能。

先来看官方定义：a Python WSGI HTTP Server for UNIX. It's a pre-fork worker model.

Q1：什么是WSGI HTTP Server？

A1：关键词在WSGI（Web Server Gateway Interface）。它不是web server，也不是web app；而正是为了将web和app解耦、再连接起来，这样的一道桥梁。因为它是一种通用接口规范，规定了web server（如Apache、Nginx）和web app(或web app框架)之间的标准。

有了它，web app开发者就能专注于业务逻辑、专注于HTML文档的生成，而不用操心繁琐的网络底层实现（HTTP请求接收、建立连接、返回响应等），并能方便地组合搭配不同的web server + web app/框架了。

Q2：什么是pre-fork worker model？

A2：“worker model”意味着：这个模型有一个master进程，来管理一组worker进程；“fork”意味着：worker进程是由master进程fork（复刻）出来的；“pre-”意味着：在任何客户端请求到来之前，就已从master进程fork出了多个worker进程，坐等请求到来。

在worker进程创建时，就被实例化了Python web app；并由worker进程监听端口、处理请求。那么，当请求到来时，worker进程就能解析HTTP请求、调用Python web app处理、得到处理结果后，再整理成HTTP Response，通过TCP返回给客户端。

而master进程是不管处理请求的，只负责管理worker进程，比如对worker进程的创建、销毁、以及根据负载情况增减。（启动时设置的--workers参数只是worker数，而Gunicorn还会创建个master进程。所以，即使配置workers为1，你的app也至少有俩进程：master负责管理，worker负责处理请求。）

（当然了，Gunicorn是WSGI的实现，但同时也自带web server，能直接对外提供web服务。包括大部分的web app框架比如Flask和Django也都带有web server。不过，在真正的生产环境的部署中，它们还是各司其职，Flask/Django只用于写app、Gunicorn只用于运行和管理Python web app，而在它们前面有专门的web server，比如Nginx。）

怎样安装和使用Gunicorn？

安装（e.g.，用Python包管理工具pip安装）：

$ pip install gunicorn

使用

起来后，Gunicorn的所有worker共用一组listener(Gunicorn支持绑定多个socket，所以说是一组)。在启动worker时，worker内为每个listener创建一个WSGI server，接收HTTP请求，并调用app对象去处理请求。

Gunicorn支持哪些worker进程？

Gunicorn支持使用不同的worker进程类型，可通过worker-class参数配置。

1. Sync Workers（同步workers）

默认的、最简单的worker模式，是同步模式。

每个worker进程，一次只处理一个请求；如果此时又有其他请求被分配到这个worker进程，那只好被阻塞了，要先等第一个请求完成。并且，一个请求一个进程，并发时，显然很占CPU和内存。

因此，只适合在访问量不大、CPU密集而非I/O密集的情形。

不过也不是没有好处；好处是，即使一个worker进程crash了，也只会影响一个请求。

2. Async Workers（异步workers）

有Gevent和Eventlet两种，都是基于Greenlet实现的。

用了异步worker，就能同时处理不止一个请求，就不会出现上面同步worker那样，一个请求就把后续请求都block阻塞住的情况了。

Q1：什么是Greenlet？

A1：Python的协程实现；可以理解为微线程。（协程是program级的“线程”，而真正的线程是OS级的。）

不同的Greenlet只能在同一个线程内的不同代码段间切换；同一个线程里，每次也只能有一个Greenlet在run。Greenlet的调度也不由系统完成，而是在用户层面实现，因而其切换的开销比线程要小。

Q2：什么是Gevent？

A2：Gevent是一个Python网络函数库，它通过Greenlet协程+libev快速事件循环，实现了异步模型。

有了Gevent，切换Greenlet时就不再需要手动切换，而是当一个Greenlet遇到I/O时，Gevent能自动切换Greenlet，保证总有Greenlet在运行，而无需等待I/O。

Gevent也有自带的WSGI Server可使用（gevent.pywsgi），但它就没有多进程的能力了，除非启动服务时，以multiprocessing的方式。

（顺便一提，Gevent最好的地方在于，当你的web app是同步处理请求的，而你又需要赋予它异步能力，那么不需改代码、只需打个猴子补丁monkey patch，Gevent就会帮你改造Python标准库和一些第三方库，使你具备异步处理请求的能力。）

异步worker是怎样实现并发，使得一个worker就能同时处理很多请求的呢？

以Gevent为例，每个请求的连接是一个Greenlet协程。Gevent虽然只有一个线程、同时只能处理一个请求，但是在这个请求的异步事件没准备好、进入IO等待时，能主动yield让出控制权、而不是阻塞其他请求的协程，而是先让其他协程执行，当自己的IO准备好时，事件循环会将它从yield让出控制权的地方，继续恢复执行。

这样，Gevent就能在不同请求间不断切换，从而实现并发，以充分利用CPU、减少IO等待。并且，因为切换的Greenlet是“微线程”，它操作的维度是函数，而不是线程/进程，所以来回切换的开销，就没有那么大。

就我个人理解，同步worker和Gevent异步worker，这两种worker类型是最常用的。一般来说，我们的web app多半属于外部IO密集型（总要访问db、访问第三方服务等等），所以用Gunicorn的Gevent异步worker，就非常合理。

而如果你的web app是CPU密集型，或者你希望请求之间不要互相影响，那么可以选择Gunicorn的同步worker。

3. Tornado Workers

用来配合Tornado使用。

Tornado是一个Python框架和网络库，可以提供异步IO非阻塞型模型，来处理长延时请求。

3. AsyncIO Workers

分成gthread和gaiohttp两种模式。

gaiohttp利用aiohttp库，在服务端和客户端执行异步IO操作。支持web socket。gthread是一种全线程worker，worker与线程池保持连接，线程会等待接收请求，一个请求一个线程。在Gunicorn启动时，除了可配置worker进程数，还可以配每个进程里的thread线程

Gunicorn是怎样实现高并发的？

上面提过，Gunicorn启动时，就把worker进程预先fork出来了。当多个请求到来的时候，会轮流复用这些worker进程，从而能提高服务器的并发负载能力。

至于worker数的配置，一般推荐2*CPU数+1。这样推荐，背后的想法是，在任何时间，都有大概一半的worker是在做I/O，剩下一半才是需要CPU的。

如果在开多进程的同时，也开多线程（也就是选择gthread类型的worker），那么，配置总的并发数（worker进程数*线程数），仍然建议2*CPU数+1。

码农公寓