Linux下并发网络设计之I/O复用

2022-09-06 09:23:12

I/O 流：

　　首先我们来定义流的概念，一个流可以是文件，socket，pipe等等可以进行I/O操作的内核对象。

　　不管是文件，还是套接字，还是管道，我们都可以把他们看作流。

　　之后我们来讨论I/O的操作，通过read，我们可以从流中读入数据；通过write，我们可以往流写入数据。

　　现在假定一个情形，我们需要从流中读数据，但是流中还没有数据，（典型的例子为，客户端要从socket读如数据，但是服务器还没有把数据传回来），这时候该怎么办？

　　阻塞：

　　　　阻塞是个什么概念呢？比如某个时候你在等快递，但是你不知道快递什么时候过来，而且你没有别的事可以干（或者说接下来的事要等快递来了才能做）；那么你可以去睡觉了，因为你知道快递把货送来时一定会给你打个电话（假定一定能叫醒你）。

　　非阻塞忙轮询：

　　　　接着上面等快递的例子，如果用忙轮询的方法，那么你需要知道快递员的手机号，然后每分钟给他挂个电话：“你到了没？”

　　很明显一般人不会用第二种做法，不仅显很无脑，浪费话费不说，还占用了快递员大量的时间。

　　大部分程序也不会用第二种做法，因为第一种方法经济而简单，经济是指消耗很少的CPU时间，如果线程睡眠了，就掉出了系统的调度队列，暂时不会去瓜分CPU宝贵的时间片了。

为了了解阻塞是如何进行的，我们来讨论缓冲区，以及内核缓冲区，最终把I/O事件解释清楚。缓冲区的引入是为了减少频繁I/O操作而引起频繁的系统调用（你知道它很慢的），当你操作一个流时，更多的是以缓冲区为单位进行操作，这是相对于用户空间而言。对于内核来说，也需要缓冲区。

假设有一个管道，进程A为管道的写入方，Ｂ为管道的读出方。

假设一开始内核缓冲区是空的，B作为读出方，被阻塞着。然后首先A往管道写入，这时候内核缓冲区由空的状态变到非空状态，内核就会产生一个事件告诉Ｂ该醒来了，这个事件姑且称之为“缓冲区非空”。

但是“缓冲区非空”事件通知B后，B却还没有读出数据；且内核许诺了不能把写入管道中的数据丢掉这个时候，Ａ写入的数据会滞留在内核缓冲区中，如果内核也缓冲区满了，B仍未开始读数据，最终内核缓冲区会被填满，这个时候会产生一个I/O事件，告诉进程A，你该等等（阻塞）了，我们把这个事件定义为“缓冲区满”。

假设后来Ｂ终于开始读数据了，于是内核的缓冲区空了出来，这时候内核会告诉A，内核缓冲区有空位了，你可以从长眠中醒来了，继续写数据了，我们把这个事件叫做“缓冲区非满”

也许事件Y1已经通知了A，但是A也没有数据写入了，而Ｂ继续读出数据，知道内核缓冲区空了。这个时候内核就告诉B，你需要阻塞了！，我们把这个时间定为“缓冲区空”。

这四个情形涵盖了四个I/O事件，缓冲区满，缓冲区空，缓冲区非空，缓冲区非满（注都是说的内核缓冲区，且这四个术语都是我生造的，仅为解释其原理而造）。这四个I/O事件是进行阻塞同步的根本。（如果不能理解“同步”是什么概念，请学习操作系统的锁，信号量，条件变量等任务同步方面的相关知识）。

然后我们来说说阻塞I/O的缺点。但是阻塞I/O模式下，一个线程只能处理一个流的I/O事件。如果想要同时处理多个流，要么多进程(fork)，要么多线程(pthread_create)，很不幸这两种方法效率都不高。

于是再来考虑非阻塞忙轮询的I/O方式，我们发现我们可以同时处理多个流了（把一个流从阻塞模式切换到非阻塞模式再此不予讨论）：

while true {

for i in stream[]; {

if i has data

read until unavailable

}

我们只要不停的把所有流从头到尾问一遍，又从头开始。这样就可以处理多个流了，但这样的做法显然不好，因为如果所有的流都没有数据，那么只会白白浪费 CPU。这里要补充一点，阻塞模式下，内核对于I/O事件的处理是阻塞或者唤醒，而非阻塞模式下则把I/O事件交给其他对象（后文介绍的select以及 epoll）处理甚至直接忽略。

为了避免CPU空转，可以引进了一个代理（一开始有一位叫做select的代理，后来又有一位叫做poll的代理，不过两者的本质是一样的）。这个代理比较厉害，可以同时观察许多流的I/O事件，在空闲的时候，会把当前线程阻塞掉，当有一个或多个流有I/O事件时，就从阻塞态中醒来，于是我们的程序就会轮询一遍所有的流（于是我们可以把“忙”字去掉了）。代码长这样:

while true {

select(streams[])

for i in streams[] {

if i has data

read until unavailable

}

于是，如果没有I/O事件产生，我们的程序就会阻塞在select处。但是依然有个问题，我们从select那里仅仅知道了，有I/O事件发生了，但却并不知道是那几个流（可能有一个，多个，甚至全部），我们只能无差别轮询所有流，找出能读出数据，或者写入数据的流，对他们进行操作。

但是使用select，我们有O(n)的无差别轮询复杂度，同时处理的流越多，没一次无差别轮询时间就越长。

再次说了这么多，终于能好好解释epoll了

epoll可以理解为event poll，不同于忙轮询和无差别轮询，epoll之会把哪个流发生了怎样的I/O事件通知我们。此时我们对这些流的操作都是有意义的。（复杂度降低到了O(1)）

在讨论epoll的实现细节之前，先把epoll的相关操作列出：

epoll_create 创建一个epoll对象，一般epollfd = epoll_create()

epoll_ctl （epoll_add/epoll_del的合体），往epoll对象中增加/删除某一个流的某一个事件

比如

epoll_ctl(epollfd, EPOLL_CTL_ADD, socket, EPOLLIN);//注册缓冲区非空事件，即有数据流入

epoll_ctl(epollfd, EPOLL_CTL_DEL, socket, EPOLLOUT);//注册缓冲区非满事件，即流可以被写入

epoll_wait(epollfd,...)等待直到注册的事件发生

（注：当对一个非阻塞流的读写发生缓冲区满或缓冲区空，write/read会返回-1，并设置errno=EAGAIN。而epoll只关心缓冲区非满和缓冲区非空事件）。

一个epoll模式的代码大概的样子是：

while true {

active_stream[] = epoll_wait(epollfd)

for i in active_stream[] {

read or write till

}

　　/*epoll+线程池 服务器端例程*/
  1 #include  <unistd.h>

 #include  <sys/types.h>       /* basic system data types */

 #include  <sys/socket.h>      /* basic socket definitions */

 #include  <netinet/in.h>      /* sockaddr_in{} and other Internet defns */

 #include  <arpa/inet.h>       /* inet(3) functions */

 #include  <sys/epoll.h>       /* epoll function */

 #include  <fcntl.h>           /* nonblocking */

 #include  <sys/resource.h>    /*setrlimit */

 #include  <pthread.h>

 #include  <assert.h>

 #include  <stdlib.h>

 #include  <errno.h>

 #include  <stdio.h>

 #include  <string.h>

 #define MAXEPOLLSIZE 10000

 #define MAXLINE 10240

 typedef struct msgdata{

         char name[];

         int connfd;

         char buffer[BUFSIZ];

         char target[];

         struct msgdata *next;

 }Msg;

 typedef struct worker{

 //回调函数，任务运行时会调用此函数，也可以声明为其他形式

 //该函数参数是任意类型的， 参数也是任意类型的;

 void * (*process)(void *arg);

 void *arg;

 struct worker *next;

 }CThread_worker;

 //线程池结构

 typedef struct{

 pthread_mutex_t queue_lock;  //互斥量

 pthread_cond_t  queue_ready; //条件变量

 //链表结构，  线程池中所有等待任务

 CThread_worker *queue_head; 

 //是否销毁线程池

 int  shutdown;

 pthread_t *threadid;

 //线程池中允许的活动线程数目

 int max_thread_num;

 //当前等待队列的任务数目

 int  cur_queue_size;

 }CThread_pool;

 int pool_add_worker(void * (*process)(void *arg), void *arg);

 void * thread_routine(void *arg);

 void * myprocess(void *arg);

 //全局静态的结构体指针

 static CThread_pool *pool = NULL;

 void pool_init(int max_thread_num)

 {

     int i;

     pool = (CThread_pool*)malloc(sizeof(CThread_pool));

     //初始化互斥量

     pthread_mutex_init(&(pool->queue_lock), NULL);

     //初始化条件变量

     pthread_cond_init(&(pool->queue_ready), NULL);

     pool->queue_head = NULL;

     //最大线程数目

     pool->max_thread_num = max_thread_num;

     //当前线程数目

     pool->cur_queue_size = ;

     pool->shutdown = ;

     pool->threadid = (pthread_t*)malloc(max_thread_num * sizeof(pthread_t));

     for(i=; i<max_thread_num; i++)

     {

         pthread_create(&(pool->threadid[i]), NULL, thread_routine, NULL);

     }

 }

 int pool_add_worker(void * (*process)(void *arg), void *arg)

 {

     //构建一个新任务

     CThread_worker *newworker = (CThread_worker *)malloc(sizeof(CThread_worker));

     newworker->process = process;

     newworker->arg = arg;

     newworker->next = NULL;

     //加锁互斥量

     pthread_mutex_lock(&(pool->queue_lock));

     //将任务加入到等待队列中

     CThread_worker *member = pool->queue_head;

     if(member != NULL)

     {

         while(member->next != NULL)

             member = member->next;

             member->next = newworker;

     }

     else  //此时 线程池中是空。

     {

         pool->queue_head = newworker;

     }

     //此时，线程池中有任务

     assert(pool->queue_head != NULL);

     pool->cur_queue_size++;

     pthread_mutex_unlock(&(pool->queue_lock));

     //等待队列中有任务了，唤醒一个等待线程；

     //如果此时所有线程都在忙碌，这句话没有任何作用，

     //因为没有线程等待，怎么唤醒呢；

     //pthread_cond_signal用于通知阻塞的线程某个特定的条件为真了

     pthread_cond_signal(&(pool->queue_ready));

         return ;

     }

     int pool_destroy()

     {

         if(pool->shutdown)

             return -;   //防止调用两次

         pool->shutdown = ;

         //唤醒所有等待线程，线程池要销毁了

         pthread_cond_broadcast(&(pool->queue_ready));

         //阻塞等待线程退出， 否则就称僵尸了；

         int i;

         for(i=; i<pool->max_thread_num; i++)

         {

             pthread_join(pool->threadid[i], NULL);

         }

         free(pool->threadid);

         //销毁等待队列

         CThread_worker *head = NULL;

         while(pool->queue_head != NULL)

         {

             head = pool->queue_head;

             pool->queue_head = pool->queue_head->next;

             free(head);

         }

         //条件变量 和 互斥量也要销毁

         pthread_mutex_destroy(&(pool->queue_lock));

         pthread_cond_destroy(&(pool->queue_ready));

         free(pool);

         //销毁后指针 置空是有必要的，但不是必须的

         pool = NULL;

         return ;

     }

     //start thread 0x b7771b70 is waiting

     //thread 0x b7771b70 is waiting

 void * thread_routine(void *arg)

 {

     printf("start thread 0x %x is waiting \n", pthread_self());

     while()

     {

         pthread_mutex_lock(&(pool->queue_lock));

         //如果线程池中运行线程数目为0，并且不销毁线程池，则处于阻塞阻塞;

         //注意：pthread_cond_wait是一个原子操作，等待前会解锁，唤醒后会加锁

         while(pool->cur_queue_size ==  && !pool->shutdown)

         {

             printf("thread 0x %x is waiting \n", pthread_self());

             //pthread_cond_wait用于等待某个特定的条件为真

             pthread_cond_wait(&(pool->queue_ready), &(pool->queue_lock));

         }

         //线程池 要销毁了；

         if(pool->shutdown)

         {

             //遇到break，continue，return等跳转语句，一定要先解锁

             pthread_mutex_unlock(&(pool->queue_lock));

             printf("thread 0x %x will exit\n", pthread_self());

             pthread_exit(NULL);

         }

             printf("thread 0x %x is starting to work \n",pthread_self());

             //使用断言

             assert(pool->cur_queue_size != );

             assert(pool->queue_head != NULL);

             //等待队列长度减去1， 并取出链表中的头元素

             pool->cur_queue_size--;

             CThread_worker *worker = pool->queue_head;

             pool->queue_head = worker->next;

             pthread_mutex_unlock(&(pool->queue_lock));

             //调用回调函数，执行任务

             (*(worker->process))(worker->arg);

             //销毁线程函数；

             free(worker);

             worker = NULL;

             printf("hello world\n");

         }

         //正常情况下，这里不能到达；

         pthread_exit(NULL);

 }

     /////////////////////////////////////////////////////

 int handle(int connfd);

 int setnonblocking(int sockfd)

 {

     if (fcntl(sockfd, F_SETFL, fcntl(sockfd, F_GETFD, )|O_NONBLOCK) == -) {

         return -;

     }

         return ;

     }

 int main(int argc, char **argv)

 {

     int  servPort = ;

     int listenq = ;

     int listenfd, connfd, kdpfd, nfds, n, nread, curfds,acceptCount = ;

     struct sockaddr_in servaddr, cliaddr;

     socklen_t socklen = sizeof(struct sockaddr_in);

     struct epoll_event ev;

     struct epoll_event events[MAXEPOLLSIZE];

     struct rlimit rt;

     char buf[MAXLINE];

     //初始化线程池的相关操作

     pool_init();  //线程池中最多3个活动的线程

     /* 设置每个进程允许打开的最大文件数 */

     rt.rlim_max = rt.rlim_cur = MAXEPOLLSIZE;

     if (setrlimit(RLIMIT_NOFILE, &rt) == -)

     {

         perror("setrlimit error");

         return -;

     }

     bzero(&servaddr, sizeof(servaddr));

     servaddr.sin_family = AF_INET;

     servaddr.sin_addr.s_addr = htonl(INADDR_ANY);

     servaddr.sin_port = htons(servPort);

     listenfd = socket(AF_INET, SOCK_STREAM, );

     if (listenfd == -) {

         perror("can't create socket file");

         return -;

     }

     int opt = ;

     setsockopt(listenfd, SOL_SOCKET, SO_REUSEADDR, &opt, sizeof(opt));

     if (setnonblocking(listenfd) < ) {

         perror("setnonblock error");

     }

     if (bind(listenfd, (struct sockaddr *) &servaddr, sizeof(struct sockaddr)) == -)

     {

         perror("bind error");

         return -;

     }

     if (listen(listenfd, listenq) == -)

     {

         perror("listen error");

         return -;

     }

     /* 创建 epoll 句柄，把监听 socket 加入到 epoll 集合里 */

     kdpfd = epoll_create(MAXEPOLLSIZE);

     ev.events = EPOLLIN | EPOLLET;

     ev.data.fd = listenfd;

             if (epoll_ctl(kdpfd, EPOLL_CTL_ADD, listenfd, &ev) < )

             {

                 fprintf(stderr, "epoll set insertion error: fd=%d\n", listenfd);

                 return -;

             }

             curfds = ;

             printf("epollserver startup,port %d, max connection is %d, backlog is %d\n", servPort, MAXEPOLLSIZE, listenq);

             for (;;) {

                 /* 等待有事件发生 */

                 nfds = epoll_wait(kdpfd, events, curfds, -);

                 if (nfds == -)

                 {

                     perror("epoll_wait");

                     continue;

                 }

                 /* 处理所有事件 */

                 for (n = ; n < nfds; ++n)

                 {

                     if (events[n].data.fd == listenfd)

                     {

                         connfd = accept(listenfd, (struct sockaddr *)&cliaddr,&socklen);

                         if (connfd < )

                         {

                             perror("accept error");

                             continue;

                         }

                         sprintf(buf, "accept form %s:%d\n", inet_ntoa(cliaddr.sin_addr), cliaddr.sin_port);

                 printf("%d:%s", ++acceptCount, buf);

                 if (curfds >= MAXEPOLLSIZE) {

                     fprintf(stderr, "too many connection, more than %d\n", MAXEPOLLSIZE);

                     close(connfd);

                     continue;

                 }

                 if (setnonblocking(connfd) < ) {

                     perror("setnonblocking error");

                 }

                 ev.events = EPOLLIN | EPOLLET;

                 ev.data.fd = connfd;

                 if (epoll_ctl(kdpfd, EPOLL_CTL_ADD, connfd, &ev) < )

                 {

                     fprintf(stderr, "add socket '%d' to epoll failed: %s\n", connfd, strerror(errno));

                     return -;

                 }

                 curfds++;

                 continue;

             }

             // 处理客户端请求    这里进入线程池内,处理用户的操作

             else

             {

                 pool_add_worker(myprocess, &(events[n].data.fd));

             }

         }

     }

     pool_destroy();

     close(listenfd);

     return ;

 }

 /*

 int handle(int connfd) {

     int nread;

     char buf[MAXLINE];

     nread = read(connfd, buf, MAXLINE);//读取客户端socket流

     if (nread == 0) {

         printf("client close the connection\n");

         close(connfd);

         return -1;

     }

     if (nread < 0) {

         perror("read error");

         close(connfd);

         return -1;

     }

     write(connfd, buf, nread);//响应客户端

     return 0;

 }

 */

 //int handle(int connfd)

 void * myprocess(void *arg)

 {

     //解包， 加锁把struct（用户名，connfd）放入链表，并在根据用户名在链表中

     //对应的connfd，

     int connfd = *((int *)arg);

     int nread;

     char buf[BUFSIZ];

     nread = read(connfd, buf, MAXLINE);//读取客户端socket流

     if (nread == )

     {

         printf("client close the connection\n");

         close(connfd);

         return NULL;

     }

     else if (nread < )

     {

         perror("read error");

         close(connfd);

         return NULL;

     }

     else

     {

     }    

     write(connfd, buf, nread);//响应客户端

     return NULL;

 }

客户端例程：

#include  <unistd.h>

#include  <sys/types.h>       /* basic system data types */

#include  <sys/socket.h>      /* basic socket definitions */

#include  <netinet/in.h>      /* sockaddr_in{} and other Internet defns */

#include  <arpa/inet.h>       /* inet(3) functions */

#include <netdb.h> /*gethostbyname function */

#include <stdlib.h>

#include <errno.h>

#include <stdio.h>

#include <string.h>

#define MAXLINE 1024

void handle(int connfd);

int main(int argc, char **argv)

{

    char * servInetAddr = "127.0.0.1";

    int servPort = ;

    char buf[MAXLINE];

    int connfd;

    struct sockaddr_in servaddr;

    if (argc == ) {

        servInetAddr = argv[];

    }

    if (argc == ) {

        servInetAddr = argv[];

        servPort = atoi(argv[]);

    }

    if (argc > ) {

        printf("usage: echoclient <IPaddress> <Port>\n");

        return -;

    }

    connfd = socket(AF_INET, SOCK_STREAM, );

      //bzero(&servaddr, sizeof(servaddr));

    servaddr.sin_family = AF_INET;

    servaddr.sin_port = htons(servPort);

    //inet_pton(AF_INET, servInetAddr, &servaddr.sin_addr);

    servaddr.sin_addr.s_addr = inet_addr(servInetAddr);

    bzero(&(servaddr.sin_zero), );

    if (connect(connfd, (struct sockaddr *) &servaddr, sizeof(servaddr)) < ) {

        perror("connect error");

        return -;

    }

    printf("welcome to echoclient\n");

    handle(connfd);     /* do it all */

    close(connfd);

    printf("exit\n");

    exit();

}

void handle(int sockfd)

{

    char sendline[MAXLINE], recvline[MAXLINE];

    int n;

    for (;;) {

        if (fgets(sendline, MAXLINE, stdin) == NULL)

        {

            break;//read eof

        }

        /*

        //也可以不用标准库的缓冲流,直接使用系统函数无缓存操作

        if (read(STDIN_FILENO, sendline, MAXLINE) == 0) {

            break;//read eof

        }

        */

        n = write(sockfd, sendline, strlen(sendline));

        n = read(sockfd, recvline, MAXLINE);

        if (n == ) {

            printf("echoclient: server terminated prematurely\n");

            break;

        }

        write(STDOUT_FILENO, recvline, n);

        //如果用标准库的缓存流输出有时会出现问题

        //fputs(recvline, stdout);

    }

}

码农公寓

I/O 流：

相关文章