I/O复用:当一个或多个I/O条件满足时,我们就被通知到,这种能力被称为I/O复用。
1.I/O复用的相关系统调用
posix的实现提供了select、poll、epoll两类系统调用以及相关的函数来实现I/O复用。select以及相关联的函数如下所示:
#include <sys/select.h>
/* 功能:监听多个fd,等待指定的fd指定的事件发生或者超时。
* nfds: 最大描述符加1。
* readfds:监听读fd集合。
* writefds:监听写fd集合。
* exceptfds:监听出错fd集合。
* timeout:超时时间,null-select一直阻塞直到指定时间发生,0-select不阻塞立刻返回。
* 返回值: 正常-返回可用fd数量,0-超时返回, -1-select调用出错,errno被设置。
*/ int select(int nfds, fd_set *readfds, fd_set *writefds,
fd_set *exceptfds, struct timeval *timeout); /* 功能: 清除set中fd对应的位。
* 返回值:无。
*/
void FD_CLR(int fd, fd_set *set);
/* 功能: 判断set中fd对应的位是否被设置。
* 返回值:0-表示没有被设置,1-表示已经被设置。
*/
int FD_ISSET(int fd, fd_set *set);
/* 功能: 设置set中fd对应的位。
* 返回值:无。
*/
void FD_SET(int fd, fd_set *set);
/* 功能: set置空。
* 返回值:无。
*/
void FD_ZERO(fd_set *set);
值得注意的是,不同的posix实现支持的最大fd_set不用,使用大描述字集应小心。另外Posix.1g还提供了系统调用pselect,如下:
#include <sys/select.h> int pselect(int nfds, fd_set *readfds, fd_set *writefds,
fd_set *exceptfds, const struct timespec *timeout,
const sigset_t *sigmask);
pselect与select存在两点不同:1、pselect支持更细粒度的超时时间(纳秒级别),而select支持微妙级别的超时时间。2、支持第六个参数,pselect调用允许传入一个信号掩码,在pselect调用期间进程的信号掩码是由sigmask指定,pselect返回前将进程的信号掩码恢复为之前的。
函数poll起源于SVR3,开始用于流设备上,现在支持任何类型的fd。poll以及相关数据结构:
#include <poll.h>
/* 功能:监听多个fd,等待感兴趣的事件发生或者超时。
* fds:pollfd类型变量的集合。
* nfds: 最大描述符加1。
* timeout:超时时间,INFTIM-poll一直阻塞直到指定时间发生,0-select不阻塞立刻返回。
* 返回值: 正常-返回可用fd数量,0-超时返回, -1-调用出错,errno被设置。
*/
int poll(struct pollfd *fds, nfds_t nfds, int timeout); struct pollfd {
int fd; /* 文件描述符 */
short events; /* 对于fd,感兴趣的事件,值参数 */
short revents; /* 对于fd,发生的事件,结果参数 */
};
指定events和测试revents用的一些常值:
1.用于读测试:{POLLIN:普通或优先级带数据可读、POLLRDNORM:普通数据可读、POLLRDBAND:优先级带数据可读}。
2.用于写测试:{POLLOUT:普通数据可写、POLLWRNORM:同POLLOUT、POLLWRBAND:优先级带数据可写}。
3.用于出错(仅用于测试revent):{POLLNVAL:描述字不是一个打开的文件、POLLHUP:被挂起、POLLERR:发生错误}。
linux在2.6内核以后加入了epoll的支持,在高性能服务器领域得到了广泛的使用。epoll的使用较为复杂,再次暂略过。select、poll、epoll的比较:
1.select ,对于几乎所有的平台都支持select,但是select存在两个缺点:a、可监听的描述符数量有限制。b、监听的描述符数量增大时,会影响程序的效率,三个描述符集都是值-结果的参数,存在两次内核-用户态之间的数据拷贝,select返回后需要遍历整个fd集合,才能知道是哪一个fd就绪。
2.poll,poll克服的select对描述符数量的限制,但当描述符数量增大时,仍存在效率问题。
3.epoll,即克服了对描述符数量的限制,同时又通过回调函数以及mmap的方式,克服了描述符数量增大时效率的问题,但是epoll的使用较为复杂。
因此当监听的fd数量较少时,采用select或poll较好,当监听的fd数量较多时采用epoll较合适。
2.基于I/O复用的回射客户端
前面的回射客户端存在一个问题:当客户端阻塞与从标准输入读时,服务器的断开不能被客户端立刻感知,造成这个问题的原因是客户端需要同时监听两个I/O:sock和标准输入,不能因为某一个阻塞而当另一个就绪时不被感知。I/O多路复用可解决这一个问题。
void
str_cli(FILE *fp, int sockfd)
{
int maxfdp1, stdineof = ;
fd_set rset; /* 监听的可读描述符集合 */
char sendline[MAXLINE], recvline[MAXLINE]; FD_ZERO(&rset); /* rset清空 */
for ( ; ; ) {
if (stdineof == )
FD_SET(fileno(fp), &rset); /* 设置标准输入fd对应的位 */
FD_SET(sockfd, &rset); /* 设置sockfd对应的位 */
maxfdp1 = max(fileno(fp), sockfd) + ; /* 计算监听的最大描述符 */
if (select(maxfdp1, &rset, NULL, NULL, NULL) < ) { /* select开始监听 */
if (errno == EINTR)
continue;
else
err_sys("select error");
} if (FD_ISSET(sockfd, &rset)) { /* sockfd变为可读 */
if (Readline(sockfd, recvline, MAXLINE) == ) {
if (stdineof == )
return; /* sockfd写已经关闭,属于正常的结束 */
else
err_quit("str_cli: server terminated prematurely");
} Writen(STDOUT_FILENO, recvline, strlen(recvline));
} if (FD_ISSET(fileno(fp), &rset)) { /* 标准输入可读 */
if (Fgets(sendline, MAXLINE, fp) == NULL) { /* 读到结束符 */
stdineof = ; /* 置1,说明已经关闭了sockfd写的一端 */
Shutdown(sockfd, SHUT_WR); /* 关闭sockfd写的一端,tcp发送fin */
FD_CLR(fileno(fp), &rset); /* 已经读到结束符,只有不需要再监听其变为可读 */
continue;
} Writen(sockfd, sendline, strlen(sendline));
}
}
}
上面的程序中,值得注意的是当我们在输入I/O中读到结束符后,函数并没有立刻退出,而是shutdown关掉sock写的一端,因为之后可能还有数据从服务器端回射回来,因此继续从sock中读数据,直到在sock读到结束符。
3.基于I/O复用的回射服务端
int
main(int argc, char **argv)
{
int i, maxi, listenfd, connfd, sockfd;
int nready;
ssize_t n;
char buf[MAXLINE];
socklen_t clilen;
struct pollfd client[OPEN_MAX];
struct sockaddr_in cliaddr, servaddr;
/* 创建并启动监听sock */
listenfd = Socket(AF_INET, SOCK_STREAM, );
bzero(&servaddr, sizeof(servaddr));
servaddr.sin_family = AF_INET;
servaddr.sin_addr.s_addr = htonl(INADDR_ANY);
servaddr.sin_port = htons(SERV_PORT);
Bind(listenfd, (SA *) &servaddr, sizeof(servaddr));
Listen(listenfd, LISTENQ); client[].fd = listenfd; /* 初始化监听sock的pollfd结构 */
client[].events = POLLRDNORM;
for (i = ; i < OPEN_MAX; i++)
client[i].fd = -; /* -1 indicates available entry */
maxi = ; /* max index into client[] array */ for ( ; ; ) {
nready = Poll(client, maxi+, INFTIM); if (client[].revents & POLLRDNORM) { /* 新的客户连接被创建,listenfd变为可读 */
clilen = sizeof(cliaddr);
connfd = Accept(listenfd, (SA *) &cliaddr, &clilen);
#ifdef NOTDEF
printf("new client: %s\n", Sock_ntop((SA *) &cliaddr, clilen));
#endif
for (i = ; i < OPEN_MAX; i++)
if (client[i].fd < ) {
client[i].fd = connfd; /* 保存新的客户连接sockfd */
break;
}
if (i == OPEN_MAX)
err_quit("too many clients"); client[i].events = POLLRDNORM;
if (i > maxi)
maxi = i; /* 更新maxi */ if (--nready <= )
continue; /* 已经不存在就绪的fd,继续poll监听 */
} for (i = ; i <= maxi; i++) { /* 遍历所有的监听fd,判断其是否就绪 */
if ( (sockfd = client[i].fd) < ) /* 未使用的pollfd结构 */
continue;
if (client[i].revents & (POLLRDNORM | POLLERR)) {
if ( (n = read(sockfd, buf, MAXLINE)) < ) {
if (errno == ECONNRESET) {
/* 连接被重置 */
#ifdef NOTDEF
printf("client[%d] aborted connection\n", i);
#endif Close(sockfd);
client[i].fd = -;
} else
err_sys("read error");
} else if (n == ) {
/* 连接被关闭 */
#ifdef NOTDEF
printf("client[%d] closed connection\n", i);
#endif
Close(sockfd);
client[i].fd = -;
} else
Writen(sockfd, buf, n); /* 已读到数据,写到sockfd,回射给客户 */
if (--nready <= )
break; /* 已经不存在就绪的fd,继续返回poll监听 */
}
}
}
}