socket选项
socket选项
下面两个系统调用专门读取和设置socket文件描述符属性的方法:
#include 《sys/socket.h>
int getsockopt(int sockfd,int level,int option_name,void* option_value,socklen_t* restrict option_len);
int getsockopt(int sockfd,int level,int option_name,const void* option_value,socklen_t option_len);
sockfd参数是指被操作的目标socket。level参数指定要操作的哪个协议写选项(即属性),比如IPv4,IPv6,TCP等。option_name参数则指定选项的名字。
level | option_name | 数据类型 | 说明 |
---|---|---|---|
SOL_SOCKET(通用socket选项,与协议无关) | SO_DEBUG | int | 打开调试信息 |
SOL_SOCKET(通用socket选项,与协议无关) | SO_REUSEADDR | int | 重用本地地址 |
SOL_SOCKET(通用socket选项,与协议无关) | SO_TYPE | int | 获取socket类型 |
SOL_SOCKET(通用socket选项,与协议无关) | SO_ERROR | int | 获取并清除socket错误状态 |
SOL_SOCKET(通用socket选项,与协议无关) | SO_DONTROUTE | int | 不查看路由表,直接将数据发送给恩地局域网内的主机,含义和send系统调用的MSG_DONTROUTE标志类似。 |
SOL_SOCKET(通用socket选项,与协议无关) | SO_RCVBUF | int | TCP接受缓冲区大小 |
SOL_SOCKET(通用socket选项,与协议无关) | SO_SNDBUF | int | TCP发送缓冲区大小 |
SOL_SOCKET(通用socket选项,与协议无关) | SO_KEEPALIVE | int | 发送周期性保活报文以维持连接 |
SOL_SOCKET(通用socket选项,与协议无关) | SO_OOBINLINE | int | 接收到的带外数据将存留在普通数据的输入队列中(在线存留),此时我们不能使用带MSG_OOB标志的读操作来读取带外数据(而应该像读取普通数据那样读取外带数据) |
SOL_SOCKET(通用socket选项,与协议无关) | SO_LINGER | linger | 若有数据待发送,则延迟关闭。 |
SOL_SOCKET(通用socket选项,与协议无关) | SO_RCVLOWAT | int | TCP接收缓存区低水位标记 |
SOL_SOCKET(通用socket选项,与协议无关) | SO_SNDLOWAT | int | TCP发送缓冲区低水位标记 |
SOL_SOCKET(通用socket选项,与协议无关) | SO_REVTIMEO | timeval | 接收数据超时 |
SOL_SOCKET(通用socket选项,与协议无关) | SO_SNDTIMEO | timeval | 发送数据超时 |
IPPROTO_IP(IPv4选项) | IP_TOS | int | 服务类型 |
IPPROTO_IP(IPv4选项) | IP_TTL | int | 存活时间 |
IPPROTO_IP6(IPv6选项) | IPV6_NEXTHOP | sockaddr_in6 | 服务类型 |
IPPROTO_IP6(IPv6选项) | IPV6_RECVPKTIFO | int | 下一跳IP地址 |
IPPROTO_IP6(IPv6选项) | IPV6_DONTFRAG | int | 禁止分片 |
IPPROTO_IP6(IPv6选项) | IPV6_RECVTCLASS | int | 接收通信类型 |
IOORITO_TCP(TCP选项) | TCP_MAXSEG | int | TCP最大报文段大小 |
IOORITO_TCP(TCP选项) | TCP_NODEELAY | int | 禁止Nage算法 |
getsocketopt和setsockopt两个函数成功时返回0,失败时返回-1并设置errno。
值得指出的是,对服务器而言,有部分socket选项只能在调用listen系统调用前针对监听socket设置才生效、这是因为连接socket只能由accept调用返回,而accept从listen监听队列中接收的连接至少已经完成了三次握手的前两个步骤(因为listen监听队列中的连接至少已经进入SYN_RECD状态),这说明服务器已经往被接受连接上发送出了TCP同步报文段。但有的socket选项却应该在TCP同步报文段中设置,比如TCP最大报文段选项。
对这种情况,Linux给开发人员提供的解决方案是:对监听socket并设置socket选项,那么accept返回的连接socket将自动继承这些选项。
这些socket选项包括:SO_DEBUG,SO_DONTROUTE,SO_KEEPALIVE,SO_LINGER,SO_OOBINLINE,SO_RCVBUF,SO_RCVLOWAT,SO_SNDBUF,SO_SNDLOWAT,TCP_MAXSEG和TCP_NODELAY。
而对客户端而言,这些socket选择则应该在调用connect函数之前设置,因为connect调用成功返回之后,TCP三次握手已经完成。
SO_REUSEADDR选项
服务器程序可以通过设置socket选项SO_REUSEADDR来强制使用被处于TIME_WAIT状态的连接占用的socket地址。具体实现方法如下:
int sock = socket(AF_INET,SOCK_STREAM,0);
assert( sock >= 0);
int resue = 1;
setsockopt(sock,SOL_SOCKET,SO_REUSEADDR,&resue,sizeof(resue));
struct sicjaddr_in address;
bzero(address,sizeof(address));
address.sin_family = AF_INET;
inet_pton(AF_INET,ip,&address.sin_addr);
address.sin_port = hton(port);
int ret = bind(sock,(sockaddr*)&address,sizeof(address));
结果setsockopt的设置之后,即使sock处于TIME_WAIT状态,与之绑定的socket地址也可以立即被重用。此外,也可以通过修改内核参数/proc/sys/net/ipv4/tcp_tw_recycle来快速回收被关闭的socket,从而是的TCP连接根本不进入TIME_WAIT状态,进而允许应用程序立即重用本地的socket地址。
SO_RCVBUF和SO_SNDBUF选项
SO_RCVBUF和SO_SNDBUF选项分别表示TCP接受缓冲区和发送缓冲区的大小。不过,当我们用setsocketopt来设置TCP的接受缓冲区和发送缓冲区的大小时,系统都会将其值加倍,并且不得小于某个最小值。TCP接受缓冲区的最小值是256字节,而发送缓冲区的最小值是2048字节(不同的系统可能有不容的默认最小值)。系统这样做的目的,主要是确保一个TCP连接拥有足够的空闲缓冲区来处理拥塞(比如快速重传算法就期望TCP接收区至少能容纳4个大小为SMSS的TCP数据报)。此外,我们也可以直接修改内核参数/proc/sys/net/ipv4/tcp_wmem来强制TCP接受缓冲区和发送缓冲区的大小没有最小值限制。
下面是客户端和服务端程序 修改缓冲区和接收区的大小:
set_send_buffer.c
#include <sys/socket.h>
#include <arpa/inet.h>
#include <assert.h>
#include <stdio.h>
#include <unistd.h>
#include <string.h>
#include <stdlib.h>
#define BUFFER_SIZE 512
int main(int argc,char* argv[])
{
if(argc <= 2)
{
printf("uage:%s ip_address port_number send_buffer_size\n",argv[0]);
return 1;
}
const char* ip = argv[1];
int port = atoi(argv[2]);
struct sockaddr_in server_address;
bzero(&server_address,sizeof(server_address));
server_address.sin_family = AF_INET;
inet_pton(AF_INET,ip,&server_address.sin_addr);,
server_address.sin_port = htons(port);
int sock = socket(AF_INET,SOCK_STREAM,0);
assert(sock >= 0);
int sendbuf = atoi(argv[3]);
int len = sizeof(sendbuf);
//设置TCP缓冲区大小 然后立即读取
setsockopt(sock,SOL_SOCKET,SO_SNDBUF,&sendbuf,sizeof(sendbuf));
getsockopt(sock,SOL_SOCKET,SO_SNDBUF,&sendbuf,(socklen_t*)&len);
printf("the tcp send buffer size after setting is %d\n",sendbuf);
if(connect(sock, (struct sockaddr*)&server_address, sizeof(server_address) ) != -1)
{
char buffer[BUFFER_SIZE];
memset(buffer,'a',BUFFER_SIZE);
send(sock,buffer,BUFFER_SIZE,0);
}
close(sock);
return 0;
}
set_recv_buffer.c
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <assert.h>
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <errno.h>
#include <string.h>
#define BUFFER_SIZE 1024
int main(int argc,char* argv[])
{
if(argc <= 2)
{
printf("uage %s ip_address port_number recv_buffer_size\n",argv[1]);
return 1;
}
const char* ip = argv[1];
int port = atoi(argv[2]);
struct sockaddr_in address;
bzero(&address,sizeof(address));
address.sin_family = AF_INET;
inet_pton(AF_INET, ip, &address.sin_addr);
address.sin_port = htons(port);
int sock = socket(AF_INET,SOCK_STREAM,0);
assert( sock >= 0);
int recvbuf = atoi(argv[3]);
int len = sizeof(recvbuf);
//先设置TCP接受缓冲区大小 然后读取
setsockopt(sock, SOL_SOCKET, SO_RCVBUF, &recvbuf,sizeof(recvbuf));
getsockopt(sock, SOL_SOCKET, SO_RCVBUF, &recvbuf,(socklen_t*)&len);
printf("the tcp receive buffer size after setting is %d\n",recvbuf);
int ret = bind(sock,(struct sockaddr*)&address, sizeof(address));
assert(ret != -1);
ret = listen(sock, 5);
assert(ret != -1);
struct sockaddr_in client;
socklen_t client_addrlength = sizeof(client);
int connfd = accept(sock, (struct sockaddr*)&client, &client_addrlength);
if(connfd < 0)
{
printf("errno is :%d\n",errno);
}
else{
char buffer[BUFFER_SIZE];
memset(buffer,'\0', BUFFER_SIZE);
while( recv(connfd, buffer, BUFFER_SIZE-1, 0) > 0 ) {};
close(connfd);
}
close(sock);
return 0;
}
从服务端的输出来看,系统允许的TCP接受缓冲区最小为256.当我们设置TCP接受缓冲区的大小为50字节时,系统将忽略我们的设置。从客户端的输出来看,我们的TCP发送缓冲区的大小被系统增加了一倍。
SO_RCVLOWAT和SO_SNDLOWAT选项
SO_RCVLOWAT和SO_SNDLOWAT选项分别表示TCP接受缓冲区的发送缓冲区的低水位标记。他们一般被I/O复用系统调用来判断socket是否可读或可写。当TCP接受缓冲区中可读数据的总数大于其低水位标记时,I/O复用系统调用将通知应用程序可以从对应的socket上读取数据;当TCP发送缓冲区中的闲置空间(可以写入数据的空间)大于其低水位时,I/O复用系统调用将通知应用程序可以往对应的socket数据写入数据。
默认情况下,TCP接受缓冲区的低水位标记和TCP发送缓冲区的低水位标记均为1字节。
SO_LINGER选项
SO_LINGER选项用于控制close系统调用在关闭TCP连接时行为。默认情况下,当我们使用close系统调用来关闭一个socket时,close将立即返回,TCP模块负责把该socket对应的TCP发送缓冲区中残留的数据发送给对方。
设置(获取)SO_LINGER选项的值时,我们需要给setsocketopt(getsocketopt)系统调用传递一个linger类型的结构体,其定义如下:
#include<sys/socket.h>
struct linger
{
int l_onoff; //开启还是关闭该选项
int l_linger; //滞留时间
};
根据linger结构体中两个成员变量的不同值,close系统调用产生如下3中行为之一:
- l_ononff等于0。此时SO_LINGER选项不起作用,close用默认行为来关闭socket。
- l_ononff不为0,ononff等于0。此时close系统调用立即返回,TCP模块丢弃被关闭的socket对应的TCP中发送缓冲区中残留的数据,同时给对方发送一个复位报文段。因此,这种行为给服务器提供了异常终止一个连接的方法。
- l_ononff不为0,l_linger大于0。此时close行为取决于两个条:一是被关闭的socket对应的TCP发送缓冲区中是否还有残留的数据;二是该socket是阻塞的,还是非阻塞。对于阻塞的socket,close将等待一段长为l_linger的时间,直到TCP模块发送完所有残留数据并得到对方确认。如果这段时间内TCP模块没有发送完残留数据并得到对方的却,那么close系统调用返回-1并设置errno为EWOULDNLOCK。如果socket是非阻塞的,close将立即返回,此时我们需要根据其返回值和errno来判断残留数据是否发送完毕。