背景
在linux网络编程中,经常需要编写关闭socket的代码,比如心跳检测失败需要关闭重连;网络报异常需要关闭重连。但究竟关闭操作做了什么,却不太清楚。目前项目使用Netty框架来实现的网络编程,查看netty源码可以得知,netty最终是调用了java Nio的close接口做的关闭操作,那么想研究清楚这个close操作究竟做了什么,可以从两个方向入手,这两个方向也是从下至上的。
- 搞清楚如果使用C/C++编程,应该调用哪个系统调用函数?函数内部做了什么,涉及到什么TCP/IP的协议参数
- 搞清楚java nio在调用close方法时,究竟使用了哪个系统调用?
本文首先解决的是第一步,搞清楚系统调用相关的知识。
相关系统调用
Linux平台下,提供了两个系统调用函数供开发人员使用:
- close函数
- shutdown函数
close函数
int close(int sockfd);
这个函数的具体行为由一个TCP/IP套接字选项控制:SO_LINGER
SO_LINGER的在头文件<sys/socket.h>中定义如下:
struct linger{
int l_onoff;
int l_linger;
}
根据这个选项参数的不同,close的逻辑如下:
1)l_onoff=0,l_linger=1或者0时(这个是默认选项)
- close会立即返回,0为成功-1为失败
- 调用进程在该套接字上不能再发送或接收请求
- 接收缓冲区中的数据将会被抛弃
- 如果发送缓冲区中还有数据,会由操作系统在后台继续发送
- 如果套接字的引用计数变为0,则发送FIN表示关闭
- 引用计数:进程和子进程可以共享一个套接字,每当一个进程做了close操作,引用计数就会减1
- 最后释放套接字的系统资源
2)l_onoff=1,l_linger=0时
- close会立即返回
- 调用进程在该套接字上不能再发送或接收请求
- 发送和接收缓冲区中的数据都会被抛弃
- 如果套接字的引用计数变为0,则发送RST到对端,并且状态直接变成CLOSED
- 注:RST没有超时重发机制,如果对端没有收到RST,继续发送,那么又会促使本端发送RST,直到对方收到
- 最后释放套接字的系统资源
3)l_onoff=1,l_linger>0时
- 如果是阻塞的socket,close函数不会立即返回;非阻塞的会立即返回
- 调用进程在该套接字上不能再发送或接收请求
- 接收缓冲区中的数据将会被抛弃
- 如果发送缓冲区中还有数据,会由操作系统在后台继续发送
- 如果套接字的引用计数变为0,则发送FIN表示关闭,在套接字状态编程CLOSED前,如果超时时间到,返回EWOULDBLOCK错误
- 最后释放套接字的系统资源
总结一下:
默认情况和第三种情况对比,默认情况相当于一个异步请求,并且无法得知操作结果;第三种情况,可以在超时时间范围内做close处理,发送未发送完毕的数据。第二种情况属于粗暴的关闭socket,在2MSL时间范围内如果新建立了一个“化身”(ip port dip dport都一样的套接字),可能会被前一个套接字相关的数据所影响。
注:对2MSL不理解的小伙伴,可以看下这篇博客,讲解的很清晰:
[ 为什么tcp的TIME_WAIT状态要维持2MSL
](https://www.cnblogs.com/abozhang/p/10974627.html)
shutdown函数
有一种业务场景,客户端发送数据到服务端,发送完毕后,客户端就可以关闭客户端写方向的连接了,等待服务端处理。
业务需求是保证客户端发送的数据都会被服务端应用程序接收并处理。如果使用close函数关闭连接,最多只能保证,全部数据都已经发送到了对端的接收缓冲区中(使用SO_LINGER相关配置项),但是无法确保对端的应用程序一定读取到数据(close以后,本端socket就无法读了)。
在这种业务场景下,如果需要确保服务端一定读取到了数据,可以考虑使用shutdown函数。
int shutdown(int sockfd,int howto);
执行shutdown函数,成功返回0,出错返回-1。
howto是这个函数的设置选项:
- SHUT_RD:关闭套接字的读方向。读缓冲区中的数据都会被抛弃,如果有新数据到达,都将被ACK,并且被悄悄丢弃。
- SHUT_WR:关闭套接字的写方向。在套接字发送缓冲区的数据都会被继续发送过去,然后发送正常的FIN开始挥手流程。
- SHUT_RDWR:读和写两个方向都关闭
只使用shutdown函数,也无法保证满足我们上面提到的业务需求,即保证服务端应用程序是否正确读取数据。目前有两种解决方式可以实现上述业务需求:
- shutdown后,使用read函数,等待对端的FIN发送过来,此时read函数返回0
- 应用级别确认:完全发送数据后,再读取一个字节的数据(这个数据是客户端和服务端的自定义协议,比如:服务端完全接受数据后,可以继续发送一字节的数据,代表读取成功)
第一种方式流程图如下(摘自《Unix网络编程》):
第二种方式流程图如下(摘自《Unix网络编程》):
close函数和shutdow函数的区别
- close函数会计算引用计数,当计数为0时才触发挥手操作;shutdown函数则不需要判断引用计数来触发挥手操作
- close函数可以终止两个方向的传输,shutdown可以控制只终止一个方向的
- close函数会关闭资源,shutdown函数不会