《Unix网络编程》卷一（简介TCP/IP、基础套接字编程）

2021-10-20 14:04:23

通常说函数返回某个错误值，实际上是函数返回值为-1，而全局变量errno被置为指定的常值（即称函数返回这个错误值）。

exit终止进程，Unix在一个进程终止时总是关闭该进程所有打开的描述符。

TCP三次握手完毕，accept返回，其返回值是一个称为已连接描述符（connected descriptor）的新描述符。调用close关闭与客户的连接。

套接字API。

TCP状态转移图，11种状态。

MSS，maximum segment size，最大分节大小。通常客户端主动打开时发送SYN的同时会发送MSS，服务端应答（SYN、ACK、MSS）时同样也发送一个MSS，不同方向上MSS可以不同。

SCTP多宿特性，单个SCTP端点能支持多个IP地址。

SCTP的四路握手。验证标记、状态cookie。

IPv4数据报最大长度65535，包括IP首部，因为总长度字段是16位；IPv6数据报最大长度65575，包括40字节IPv6首部，因为净长度字段是16位。

IPv4首部20字节（固定长度），另外还有最多40字节可选部分。

套接字地址结构在内核和进程间传递，从进程传到内核，从内核传到进程，不是非常理解，应该就是参数传递进去和被写回吧？另外有一个值-结果参数以前很少碰到。

每个文件或套接字都有一个引用计数，引用计数在文件表项中维护。

存放在硬盘上的可执行程序文件能被Unix执行的唯一方法是：由一个现有进程调用六个exec函数中的一个。（理解）

六个exec函数区别在于：待执行程序由文件名还是路径名指定；参数是一一列出还是指针数组；把调用进程环境传递给新程序还是指定新环境。

子进程调用exec时，子进程内存映像被替换成新程序文件，只有文件描述符（在socket中是已连接套接字描述符）跨exec继续保持开放。

一个简单echo客户/服务器程序涉及到的一些细节（非常重要）：

僵死子进程，通过捕获SIGCHLD信号加以处理；

信号处理函数必须调用waitpid而不是wait，因为unix信号是不排队的，当有多个子进程时wait函数只能处理第一个，后面的将变成僵死进程；

另一个问题是服务器进程终止时，客户进程没被告知，因为客户进程阻塞于等待用户输入而未接收到通知，这需要select或poll函数来处理，它们等待多个描述符中的任何一个就绪而不是阻塞于某个描述符。

select函数中间的三个参数（读、写、异常描述符集）都是值—结果参数，返回时，未就绪描述符对应的被置0，其他是1，重新调用时，将所关心位重置1。

close函数有两个限制，shutdown函数可以克服，它关闭一半tcp连接（可参数选读或者写）。

pselect时间参数结构不同；另一个不同点是多了一个指向信号掩码的指针，从而运行程序先禁止提交某些信号。

拒绝服务（denial of service，DoS）型攻击。

UDP也可以使用connect函数，成为已连接UDP套接字，然后可以使用write和read函数读写，而不是sento和recvfrom。

DNS中的条目称为资源记录（resource record，RR）。常见RR类型有：A、AAAA、PTR、MX、CNAME。

gethostbyname和gehostbyaddr的返回值均为一个hostent（host entry缩写）结构：

struct    hostent {

    const char    *h_name;    // 主机的正式名称。

    char    **h_aliases;    //  空字节-地址的预备名称的指针。

    short    h_addrtype;    // 地址类型; 通常是AF_INET。

    short    h_length;    // 地址的比特长度

    char    **h_addr_list;    //  主机网络地址指针（只有IPV4）

   #define    h_addr    h_addr_list[0]    // h_addr 为 h_addr_list中的第一地址。

｝;

gethostbyname只能返回IPV4地址，而getaddrinfo能够同时处理IPV4和IPV6地址。

gethostbyname和gehostbyaddr用于主机名和地址的映射，而getservbyname和getservbyport则用于服务与端口之间的映射。

getaddrinfo能处理名字到地址、服务到端口的转换（由参数中列表中第一个为主机名，第二个为服务名可看出）：

int getaddrinfo( const char *hostname,

    const char *service,

    const struct addrinfo *hints,

    struct addrinfo **result );//返回结果保存到这里

其中，保存返回结果的struct addrinfo结构体详细信息如下：

表头文件: #include<netdb.h>

struct addrinfo

{

int ai_flags;

int ai_family; //AF_INET,AF_INET6,UNIX etc

int ai_socktype; //STREAM,DATAGRAM,RAW

int ai_protocol; //IPPROTO_IP, IPPROTO_IPV4, IPPROTO_IPV6 etc

size_t ai_addrlen;//length of ai_addr

char* ai_canonname; //full hostname

struct sockaddr* ai_addr; //addr of host

struct addrinfo* ai_next;

}

value of ai_falgs:

AI_PASSIVE: Socket address is intended for `bind'.

AI_CANONNAME:Request for canonical name.

AI_NUMERICHOST: Don't use name resolution.

AI_V4MAPPED: IPv4 mapped addresses are acceptable.

AI_ALL: Return IPv4 mapped and IPv6 addresses.

AI_ADDRCONFIG:Use configuration of this host to choose

定义函数:

int getaddrinfo( const char *hostname, const char *service, const struct addrinfo *hints,

struct addrinfo **result );

函数说明:

      getaddrinfo函数能够处理名字到地址以及服务到端口这两种转换，返回的是一个sockaddr 结构的链而 不是一个地址清单。它具有协议无关性。

      hostname:一个主机名或者地址串(IPv4的点分十进制串或者IPv6的16进制串)

      service：一个服务名或者10进制端口号数串。

       hints：可以是一个空指针，也可以是一个指向某个addrinfo结构的指针，调用者在这个结构中填入关于期望返回的信息类型的暗示。举例来说：如果指定的服务既支持TCP也支持UDP，那么调用者可以把hints结构中的ai_socktype成员设置成SOCK_DGRAM使得返回的仅仅是适用于数据报套接口的信息。返回0： 成功，返回非0： 出错。

定义函数:const char *gai_strerror( int error );

函数说明:

      该函数以getaddrinfo返回的非0错误值的名字和含义为他的唯一参数，返回一个指向对应的出错信息串的指针。

定义函数: void freeaddrinfo( struct addrinfo *ai );

函数说明:

       由getaddrinfo返回的所有存储空间都是动态获取的，这些存储空间必须通过调用freeaddrinfo返回给系统。

struct addrinfo结构体

与getaddrinfo函数对应的是getnameinfo函数。

在linux环境下，结构体struct sockaddr在/usr/include/linux/socket.h中定义，具体如下：

typedef unsigned short sa_family_t;

struct sockaddr {

        sa_family_t     sa_family;    /* address family, AF_xxx       */

        char            sa_data[];    /* 14 bytes of protocol address */

在linux环境下，结构体struct sockaddr_in在/usr/include/netinet/in.h中定义，具体如下：

/* Structure describing an Internet socket address. */

struct sockaddr_in

{

    __SOCKADDR_COMMON (sin_);

    in_port_t sin_port;                     /* Port number. */

    struct in_addr sin_addr;            /* Internet address. */

    /* Pad to size of `struct sockaddr'. */

    unsigned char sin_zero[sizeof (struct sockaddr) -

                           __SOCKADDR_COMMON_SIZE -

                           sizeof (in_port_t) -

                           sizeof (struct in_addr)];

                           /* 字符数组sin_zero[8]的存在是为了保证结构体struct sockaddr_in的大小和结构体struct sockaddr的大小相等 */

};

struct sockaddr是通用的套接字地址，而struct sockaddr_in则是internet环境下套接字的地址形式，二者长度一样，都是16个字节。二者是并列结构，指向sockaddr_in结构的指针也可以指向sockaddr。一般情况下，需要把sockaddr_in结构强制转换成sockaddr结构再传入系统调用函数中。

下面是struct sockaddr_in中用到两个数据类型，具体定义如下：

/* Type to represent a port. */

typedef uint16_t in_port_t; 

struct in_addr其实就是32位IP地址

struct in_addr {

        unsigned long s_addr;

};

BSD网络软件中包含了两个函数，用来在二进制地址格式和点分十进制字符串格式之间相互转换，但是这两个函数仅仅支持IPv4。

       in_addr_t inet_addr(const char *cp);

       char *inet_ntoa(struct in_addr in);

功能相似的两个函数同时支持IPv4和IPv6

       const char *inet_ntop(int domain, const void *addr, char *str, socklen_t size);

       int inet_pton(int domain, const char *str, void *addr);

通常的用法是：

int sockfd;

struct sockaddr_in my_addr;

sockfd = socket(AF_INET, SOCK_STREAM, ); 

my_addr.sin_family = AF_INET; /* 主机字节序 */

my_addr.sin_port = htons(MYPORT); /* short, 网络字节序 */

my_addr.sin_addr.s_addr = inet_addr("192.168.0.1");

bzero(&(my_addr.sin_zero), ); /* zero the rest of the struct */

//memset(&my_addr.sin_zero, 0, 8);

bind(sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr));

#define UNIX_PATH_MAX 108

  struct sockaddr_un {

  sa_family_t sun_family; /*PF_UNIX或AF_UNIX */

  char sun_path[UNIX_PATH_MAX]; /* 路径名 */

  };

struct sockaddr结构类型是用来保存socket信息的：

　　 struct sockaddr {

　　 unsigned short sa_family; /* 地址族， AF_xxx */——地址的格式

  char sa_data[]; /* 14 字节的协议地址 */——地址值(IP和端口号)

  };

Sockfd是调用socket函数返回的socket描述符,my_addr是一个指向包含有本机IP地址及端口号等信息的sockaddr类型的指针；addrlen常被设置为sizeof(struct sockaddr)。

　　struct sockaddr结构类型是用来保存socket信息的：

　　struct sockaddr {

　　 unsigned short sa_family; /* 地址族， AF_xxx */

char sa_data[]; /* 14 字节的协议地址 */

};

　　sa_family一般为AF_INET，代表Internet（TCP/IP）地址族；sa_data则包含该socket的IP地址和端口号。

　　另外还有一种结构类型：

　　struct sockaddr_in {

　　 short int sin_family; /* 地址族 */

　　 unsigned short int sin_port; /* 端口号 */

　　 struct in_addr sin_addr; /* IP地址 */

　　 unsigned char sin_zero[]; /* 填充0 以保持与struct sockaddr同样大小 */

　　};

　 　这个结构更方便使用。sin_zero用来将sockaddr_in结构填充到与struct sockaddr同样的长度，可以用bzero()或memset()函数将其置为零。指向sockaddr_in 的指针和指向sockaddr的指针可以相互转换，这意味着如果一个函数所需参数类型是sockaddr时，你可以在函数调用的时候将一个指向 sockaddr_in的指针转换为指向sockaddr的指针；或者相反。

你只要记住，填值的时候使用sockaddr_in结构，而作为函数的

参数传入的时候转换成sockaddr结构就行了，毕竟都是16个字符

长。

struct in_addr {

union {

struct { u_char s_b1,s_b2,s_b3,s_b4; } S_un_b;

struct { u_short s_w1,s_w2; } S_un_w;

u_long S_addr;

} S_un };

struct sockaddr与struct sockaddr_in ,struct sockaddr_un的区别和联系

inet_pton函数将点分十进制格式IP地址转换为二进制整数，IPV4和IPV6都支持：

inet_pton：将“点分十进制” －> “二进制整数”

int inet_pton(int af, const char *src, void *dst);

这个函数转换字符串到网络地址，第一个参数af是地址簇，第二个参数*src是来源地址，第三个参数* dst接收转换后的数据。

inet_pton 是inet_addr的扩展，支持的多地址族有下列：

af = AF_INET

src为指向字符型的地址，即ASCII的地址的首地址（ddd.ddd.ddd.ddd格式的），函数将该地址转换为in_addr的结构体，并复制在*dst中。

af = AF_INET6

src为指向IPV6的地址，函数将该地址转换为in6_addr的结构体，并复制在*dst中。

如果函数出错将返回一个负值，并将errno设置为EAFNOSUPPORT，如果参数af指定的地址族和src格式不对，函数将返回0。

码农公寓

相关文章