Socket 编程基础

1. 网络字节序

1.1 字节序简介

      小端字节序:低字节保存在低位地址,高字节保存在高位地址

      大端字节序:低字节保存在高位地址,高字节保存在低位地址

      网络数据流地址:发送主机通常将发送缓冲区中的数据按内存地址从低到高一次发送,接收主机把网络上接到的字节依次保存在接收缓冲区内,同样按低到高的顺序保存,因此,网络数据流应先发出的数据是低地址,后发出的数据是高地址。

      TCP/IP协议规定:网络数据流应使用大端字节序,即低地址高字节。

      例如端口号1001(0x03e9)由两个字节保存,则低地址保存0x03,高地址保存0xe9,发送先发低地址0x03然后发高地址0xe9。

      如果发送端系统采用的字节序不一致,将会导致数据不统一,这时需要字节转换,在把1001填充到发送缓冲区之前先进行字节序转换,接收端亦同理,如果主机都是大端字节序则发送接收都不用进行字节序转换。32位的IP也要考虑网络字节序和主机字节序之间的关系。

1.2 字节序转换

      为使网络程序具备可移植性,可以通过以下函数进行大小端字节序转换:

#include<arpa/inet.h>


nunit32_t htonl(unit32_t hostlong);     //主机字节序转换成网络字节序
nunit16_t htons(unit16_t hostshort);
nunit32_t ntohl(unit32_t netlong);      //网络字节序转换成主机字节序
nunit16_t ntohs(unit16_t netshort);
// h 表示 host,n 表示 network,l 表示32位长整型 long,s 表示16位短整型 short

      如果主机是小端字节序,则会进行相应的转换,如果是大端字节序则不会进行转换。

2. sockaddr数据结构与IP地址转换函数

2.1 sockaddr数据结构

     很多网络编程函数诞生早于IPv4协议,而这些协议通常使用sockaddr结构体,为了向前兼容,sockaddr退化成了(void *)作用,传递一个地址给函数,函数类型由地址族决定,然后强制类型转换回所需类型。

         struct                                                                                                                struct

      sockaddr                                                                                                      sockaddr_in

16位地址类型

      14字节

    地址数据

  16位地址类型:

   AF_INET

     16位端口号
32位IP地址
8字节填充


   

struct sockaddr {

    sa_family_t   sa_family;         //地址族 AF_xxxx    ,IPv4  AF_INET,IPv6  AF_INET6
    char    sa_data[14];            //14字节地址数据

}

struct sockaddr_in {

    sa_family_t   sin_family;        //地址族 AF_INET
    in_port_t   sin_port;            //网络字节序的端口号
    struct in_addr   sin_addr;       //网络(IP)地址

}

struct in_addr {

    uint32_t     s_addr;             //网络字节序的网络(IP)地址

}

     IPv4的地址格式定义在 netinet/in.h 中,使用 sockaddr_in 结构体表示,因为sock API的实现早于ANSI C标准化,没有void *类型,因此使用struct sockaddr结构体的函数类似bind、accept时需要强制类型转换,如:   

struct sockaddr_in  server_addr;

bind(listen_fd, (struct sockaddr *)&server_addr, sizeof(server_addr));

2.2 IP地址转换函数

#include <arpa/inet.h>    //头文件

int inet_pton(int af, const char *src, void *dst);
const char *inet_ntop(int af, const void *src, char *dst, socklen_t size);

     af 取值为 AF_INET 和 AF_INET6 ,和 ipv4 和ipv6对应

     inet_pton和inet_ntop不仅可以转换IPv4的 in_addr,还可以转换IPv6的i n6_addr。

     故其函数接口是void *addrptr。

范例:

#include <stdio.h>
#include <string.h>
#include <arpa/inet.h>



int main(void){

    char ip[]="2.3.4.5";
    char server_ip[64];

    struct sockaddr_in server_addr;


    inet_pton(AF_INET, ip, &server_addr.sin_addr.s_addr);

    printf("s_addr : %x\n", server_addr.sin_addr.s_addr);

    printf("s_addr from net to host: %x\n", ntohl(server_addr.sin_addr.s_addr));

    inet_ntop(AF_INET, &server_addr.sin_addr.s_addr, server_ip, 64);

    printf("server ip : %s\n", server_ip);

    printf("INADDR_ANY: %d\n", INADDR_ANY);
    server_addr.sin_addr.s_addr = INADDR_ANY;
    inet_ntop(AF_INET, &server_addr.sin_addr.s_addr, server_ip, 64);
    printf("INADDR_ANY ip : %s\n", server_ip);
    return 0;
}

3. Socket编程函数

3.1 socket 函数

头文件

#include <sys/types.h>

#include <sys/socket.h>

函数名

     int socket(int domain, int type, int protocol);

参数:

     domain:

          AF_INET     这是大多数用来产生socket的协议,使用TCP或UDP来传输,用IPv4的地址

          AF_INET6   与上面类似,不过是来用IPv6的地址

          AF_UNIX     本地协议,使用在Unix和Linux系统上,一般都是当客户端和服务器在同一台及其上的时候使用

     type:

          SOCK_STREAM     这个协议是按照顺序的、可靠的、数据完整的基于字节流的连接。这是一个使用最多的socket类型,这个socket是使用TCP来进行传输。

          SOCK_DGRAM      这个协议是无连接的、固定长度的传输调用。该协议是不可靠的,使用UDP来进行它的连接。

          SOCK_SEQPACKET   该协议是双线路的、可靠的连接,发送固定长度的数据包进行传输。必须把这个包完整的接受才能进行读取。

          SOCK_RAW socket    类型提供单一的网络访问,这个socket类型使用ICMP公共协议。(ping、traceroute使用该协议)

          SOCK_RDM      这个类型是很少使用的,在大部分的操作系统上没有实现,它是提供给数据链路层使用,不保证数据包的顺序

     protocol:

          传0 表示使用默认协议。

返回值:

     成功:返回指向新创建的socket的文件描述符,失败:返回-1,设置errno

作用:

     socket()打开一个网络通讯端口,如果成功的话,就像open()一样返回一个文件描述符,应用程序可以像读写文件一样用read/write在网

络上收发数据,如果socket()调用出错则返回-1。对于IPv4,domain参数指定为AF_INET。对于TCP协议,type参数指定为

SOCK_STREAM,表示面向流的传输协议。如果是UDP协议,则type参数指定为SOCK_DGRAM,表示面向数据报的传输协议。protocol参数介绍略,指定为0即可。

3.2 bind 函数

头文件:

#include <sys/types.h> /* See NOTES */
#include <sys/socket.h>

函数名:

     int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);

参数:

     sockfd         socket文件描述符

     addr:           构造出IP地址加端口号

     addrlen       sizeof(addr)长度

返回值:

     成功返回0,失败返回-1, 设置errno

作用:

     服务器程序所监听的网络地址和端口号通常是固定不变的,客户端程序得知服务器程序的地址和端口号后就可以向服务器发起连接,因

此服务器需要调用bind绑定一个固定的网络地址和端口号。

     bind()的作用是将参数sockfd和addr绑定在一起,使sockfd这个用于网络通讯的文件描述符监听addr所描述的地址和端口号。前面讲过,

struct sockaddr *是一个通用指针类型,addr参数实际上可以接受多种协议的sockaddr结构体,而它们的长度各不相同,所以需要第三个参

数addrlen指定结构体的长度。如:

struct sockaddr_in servaddr;

bzero(&servaddr, sizeof(servaddr));

servaddr.sin_family = AF_INET;

servaddr.sin_addr.s_addr = htonl(INADDR_ANY);

servaddr.sin_port = htons(6666);

     首先将整个结构体清零,然后设置地址类型为AF_INET,网络地址为INADDR_ANY,这个宏表示本地的任意IP地址,因为服务器可能有

多个网卡,每个网卡也可能绑定多个IP地址,这样设置可以在所有的IP地址上监听,直到与某个客户端建立了连接时才确定下来到底用哪

个IP地址,端口号为6666。

3.3 listen 函数

头文件:

#include<sys/types.h>
#include<sys/socket.h>

函数名:

     int listen(int sockfd, int backlog);

参数:

     sockfd      socket文件描述符

     backlog    在Linux 系统中,它是指排队等待建立3次握手队列长度

查看系统默认backlog

cat /proc/sys/net/ipv4/tcp_max_syn_backlog

改变 系统限制的backlog 大小

vim /etc/sysctl.conf

     最后添加

net.core.somaxconn = 1024
net.ipv4.tcp_max_syn_backlog = 1024

     保存,然后执行

sysctl -p

     典型的服务器程序可以同时服务于多个客户端,当有客户端发起连接时,服务器调用的accept()返回并接受这个连接,如果有大量的客户端发起连接而服务器来不及处理,尚未accept的客户端就处于连接等待状态,listen()声明sockfd处于监听状态,并且最多允许有backlog个客户端处于连接待状态,如果接收到更多的连接请求就忽略。listen()成功返回0,失败返回-1。

3.4 accept 函数

头文件:

#include<sys/types.h>
#include<sys/socket.h>

函数名:

     int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);

参数:

     sockfd      socket文件描述符

     addr         传出参数,返回链接客户端地址信息,含IP地址和端口号

     addrlen    传入传出参数(值-结果),传入sizeof(addr)大小,函数返回时返回真正接收到地址结构体的大小

返回值:

    成功返回一个新的socket文件描述符,用于和客户端通信,失败返回-1,设置errno

    三次握手完成后,服务器调用accept()接受连接,如果服务器调用accept()时还没有客户端的连接请求,就阻塞等待直到有客户端连接上来。addr是一个传出参数,accept()返回时传出客户端的地址和端口号。addrlen参数是一个传入传出参数(value-result argument),传入的是调用者提供的缓冲区addr的长度以避免缓冲区溢出问题,传出的是客户端地址结构体的实际长度(有可能没有占满调用者提供的缓冲区)。如果给addr参数传NULL,表示不关心客户端的地址。

我们的服务器程序结构是这样的:

while (1) {

    cliaddr_len = sizeof(cliaddr);

    connfd = accept(listenfd, (struct sockaddr *)&cliaddr, &cliaddr_len);

    n = read(connfd, buf, MAXLINE);

    ......

    close(connfd);

}

    整个是一个while死循环,每次循环处理一个客户端连接(串行)。由于cliaddr_len是传入传出参数,每次调用accept()之前应该重新赋初值。accept()的参数listenfd是先前的监听文件描述符,而accept()的返回值是另外一个文件描述符connfd,之后与客户端之间就通过这个connfd通讯,最后关闭connfd断开连接,而不关闭listenfd,再次回到循环开头listenfd仍然用作accept的参数。accept()成功返回一个文件描述符,出错返回-1。

3.5 connect 函数

头文件:

#include<sys/types.h>
#include<sys/socket.h>

函数名:

    int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);

参数:

sockdf        socket文件描述符

addr           传入参数,指定服务器端地址信息,含IP地址和端口号

addrlen      传入参数,传入sizeof(addr)大小

返回值:

    成功返回0,失败返回-1,设置errno

    客户端需要调用connect()连接服务器,connect和bind的参数形式一致,区别在于bind的参数是自己的地址,而connect的参数是对方的地址。connect()成功返回0,出错返回-1。

3.6 出错处理函数

    我们知道,系统函数调用不能保证每次都成功,必须进行出错处理,这样一方面可以保证程序逻辑正常,另一方面可以迅速得到故障信息。

出错处理函数

头文件:

#include <errno.h>

#include <string.h>

函数名:

    char *strerror(int errnum); 

参数:

    errnum    传入参数,错误编号的值,一般取 errno 的值

返回值:

    错误原因

头文件:

#include <stdio.h>

#include <errno.h>

函数名

    void perror(const char *s);   

参数

    s      传入参数,自定义的描述

返回值:

    无

    向标准出错stderr 输出出错原因

上一篇:TCP/IP协议栈模型分析


下一篇:TCP/IP协议栈模型分析