发展
最基础的 TCP Socket 编程是阻塞的 IO 模型,只能一对一通信,为了服务更多的客户端,需要进行改进。
传统的方式是使用多进程模型,每来一个客户端连接,就分配一个进程,但当连接量很大,性能会很低。
于是就有了 IO 多路复用,可以在一个进程中处理多个连接,实现方式有 select、poll、epoll。
select、poll
select、poll 没有本质的区别,都是使用线性结构存储进程关注的 Socket 集合。只不过,select 使用的线性结构是 BitsMap,有大小限制。而 poll 用动态数组,突破了 select 的个数限制。
select、poll 在使用时,
• 先把集合从用户态拷贝到内核态,让内核来检查是否有事件发生。
• 当有事件发生时,内核通过遍历从集合中找到对应的 Socket,并设置其状态为可读/可写。
• 然后把集合拷贝回用户态,用户态通过遍历从中找到可读/可写的 Socket,进行处理。
因此,select 和 poll 的问题在于,当 Socket 集合很大时,拷贝、遍历的开销大,性能会很差。
epoll
于是就有了 epoll,通过两个方面解决了 select 和 poll 的问题。
- 内核使用红黑树存放待检测的 Socket。这样,每次操作时,只需传入一个 Socket,无需像 select 和 poll 那样传入整个集合,从而减少了大量的拷贝。
- 使用事件驱动机制,内核使用一个链表记录有事件发生的 Socket。这样,每次操作时,只需将其返回给应用程序,无需像 select 和 poll 那样遍历整个集合,从而提高了检测的速度。