一、概述
1、socket是一种进程间通信方式,既可以用于一台机器,也可以用于网络。常用语C/S模型。
2、可以跨越Windows和Linux操作系统,可以跨越不同语言。
3、注意网络字节序和主机字节序的转换;可以不用判断,直接调用函数,函数内部会做出判断。
二、socket()
1、<sys/types.h><sys/socket.h>
2、int socket(int domain,int type,int protocol);
3、domain:创建套接字所使用的协议簇(地址)
AF_UNIX:本机
AF_INET:IPv4
AF_INET6:IPv6
AF:address family
4、type:套接字类型
SOCK_STREAM:流,用于tcp
SOCK_DGRAM:数据报,用于UDP
SOCK_RAW:原始,可以操作ICMP等
5、protocol:协议,Linux下默认为0,即由domain和type可以确定所使用的协议。
6、返回值:成功后,返回套接字;否则,返回-1,错误存入errno。
7、可以理解为:domain是网络层的参数,type是传输层的参数。
三、bind()
1、<sys/types.h><sys/socket.h>
2、int bind(int sockfd,sockaddr* my_addr,socklen_t addlen);
3、作用:将IP地址+端口和socket绑定。一般服务器需要,客户端不需要bind()。但是实际上,对于UDP,客户端在发送时,内核都会自动绑定(将IP地址+端口和socket绑定);对于TCP,个人认为应该不会,因为服务器端通过连接返回,所以客户端不用bind()。
4、sockfd:socket文件描述符;addlen:sockaddr结构的长度。
5、返回值:成功0,失败,返回-1,错误存入errno。
6、struct sockaddr是通用的套接字地址,实际上很少使用,而是使用sockaddr_in。
7、struct sockaddr_in(TCP/IP协议簇常用)
(1)头文件:<netinet/in.h>
(2)定义
struct sockaddr_in{
unsigned short sin_family;//AF_INET(TCP/IP)
unsigned short sin_port;//0-1023特用
struct in_addr sin_addr;//32位IP地址
unsigned char sin_zero[8];//填充
};
struct in_addr{
unsigned long s_addr;//或in_addr_t
};
s_addr可以设置为INADDR_ANY,表示本机上的所有IP(多宿主主机有多个网卡)
四、listen()
1、<sys/types.h><sys/socket.h>
2、int listen(int sockfd,int backlog);
3、功能:一般在服务器端使用。初始化服务器可连接队列,由于是顺序处理连接请求,所有将暂时不能处理的放到等待队列里面,长度由backlog确定。
4、backlog:连接队列的最大长度,一般为20,有时为10或5。
5、返回值:成功0,失败,返回-1,错误存入errno。
6、注意,listen()是非阻塞调用,listen()执行后,套接字处于监听状态,进程处于执行状态,即一个套接字listen()一次即可,直至进程退出才会失效。
五、accept()
1、<sys/types.h><sys/socket.h>
2、int accept(int sockfd,sockaddr *addr,socklen_t *addrlen);
3、功能:当一个客户端的连接请求到达服务器监听接口时,在队列中等待;accept()执行后,返回一个套接字描述表示一个客户端的连接,并用这个套接字进行send()和recv()。
4、返回值:成功后,返回代表连接的套接字(性质与sockfd相同),失败,返回-1,错误存入errno。
5、若sockfd是阻塞的,且连接队列为空,则accept()将被阻塞知道有连接请求为止;若为非阻塞的,且连接队列为空,则accept()返回-1,errno被设置为EAGAIN。
6、注意,accept发生的阶段是三次握手之后,即从连接队列中取出相应连接进行处理。
六、connect()
1、<sys/types.h><sys/socket.h>
2、int connect(int sockfd,sockaddr *addr,socklen_t addrlen);
3、功能:一般在客户端使用。客户端发出连接请求,因为客户端的地址不重要(服务器通过连接返回),因此客户端无需bind()。一个socket只能connect一个主机。
4、返回值:成功0,失败,返回-1,错误存入errno。
七、send()和recv()
1、<sys/types.h><sys/socket.h>
2、函数原型
ssize_t send(int conn_fd,const void *msg,size_t len,int flags);
ssize_t recv(int conn_fd,void *buf,size_t len,int flags);
3、服务器端和客户端都可以send()和recv()。注意,send()只是将数据由msg存入socket的缓冲区里面,具体的发送操作由操作系统完成;同理,recv()是将socket缓冲区里面的数据读到buf中,具体的接收操作也是由操作系统完成的。
4、参数说明
conn_fd:连接好的套接字
msg/buf:发送或接受数据的缓冲区
len:缓冲区长度
flags:控制选项,一般为0。
5、返回值:成功,返回实际发送或接受的字节数,失败,返回-1,错误存入errno。
6、疑问:对于UDP,也是在缓冲区中取出,但是UDP是有边界的呀??todo
7、可以利用recv的返回值以及等待时间,来判断是否停止接受。
八、close()
1、<unistd.h>
2、int close(int fd);
3、关闭一个套接字描述符。
4、返回值:成功0,失败,返回-1,错误存入errno。
九、地址转换
1、<arpa/inet.h>
2、点分十进制字符串转化为unsigned long/in_addr_t
in_addr_t inet_addr(const char* cp);
3、in_addr转化为点分十进制字符串:inet_ntoa();
十、TCP与UDP的差异
1、UDP在connect的时候,不会进行三次握手,甚至不会发送任何数据包;只是发送/接收的时候不再需要指定对方的地址(内核记录了IP地址和端口)。
因此我认为,UDP客户端可以不connect。
2、UDP服务器端不需要listen和accept,可以直接接收;但是有了之后,服务端也记录了客户端的IP地址和端口,每次发送和接收的时候不需要sendto()、recvfrom()。
3、对于服务器端:UDP的服务器端可以不需要绑定,使用sendto和recvfrom,但是TCP的服务器端必须绑定,因为在sendto和recvfrom之前还要listen和accept。
对于客户端:TCP和UDP都不需要bind。TCP因为建立了连接,可以按照连接返回(其实连接还是按IP+端口确定的)。UDP客户端在第一次发送时,内核也会将IP地址和端口与socket绑定。
注意,绑定的含义是将socket与IP地址和端口绑定;无论是否绑定,数据包中肯定是有IP地址和端口的。
4、综合1、2、3可知,UDP的客户端可以新建一个socket后,直接使用sendto发送数据;UDP的服务器端可以新建一个socket后,直接用recvfrom接收数据。
5、区分TCP和UDP的方式:socket的类型是SOCK_STREAM还是SOCK_DGRAM;而不是使用了哪些函数,因为由上述可知,TCP与UDP使用的函数可能相同。
十一、阻塞与非阻塞
1、受影响的函数:connect、accept、send、recv等。
(1)connect(TCP)
非阻塞:connect会立即返回EINPROGRESS错误,表示连接操作正在进行中,但是仍未完成;同时TCP的三路握手操作继续进行;在这之后,我们可以调用select来检查这个链接是否建立成功。
阻塞:线程阻塞,若连接在超时之前建立,则返回0;若超时(一般为75s-几分钟),则返回负数。
(2)accept(TCP):见五、5
(3)send、recv
非阻塞:如果缓冲区有空间或者有内容,立马返回实际放入或取出的字节数,如果没有,立马返回-1。
阻塞:如果有足够空间或者内容,肯定就返回n了;如果完全没有空间或者内容,肯定就返回-1了;但是如果有部分空间或者内容,是等待呢,还是返回??todo
2、阻塞模式效率低,编程简单,适用于小型系统;非阻塞模式效率高,但是编程复杂,适用于大型系统。
3、(貌似)SOCK_STREAM默认是阻塞的,SOCK_DGRAM默认是非阻塞的。
4、fctnl或者select可以转换socket的阻塞属性。