Socket网络编程-基础篇

Socket网络编程

网络通讯三要素:

  • IP地址[主机名]
    • 网络中设备的标识
    • 本地回环地址:127.0.0.1 主机名:localhost
  • 端口号
    • 用于标识进程的逻辑地址
    • 有效端口:0~65535
    • 其中0~1024由系统使用或者保留端口,开发中不要使用1024一下的端口
  • 传输协议[通讯的规则]
    • TCP
    • UDP

常见网络协议

协议 端口 说明
HTTP 80 超文本传输协议
HTTPS 443 HTTP+SSL,HTTP的安全版
FTP 20,21,990 文件传输
POP3 110 邮件协议
SMTP 25 简单邮件传输协议
telnet 23 远程终端协议

网络参考模型

Socket网络编程-基础篇

TCP & UDP

UDP(User Datagram Protocol 用户数据报)

  • 只管发送,不确认对方是否接收到
  • 将数据及源和目的封装成数据包中,不需要建立连接
  • 每个数据报的大小限制在64k之内
  • 因为无需连接,因此是不可靠协议,但是传输速度快

TCP(Transmission Control Protocol 传输控制协议)

  • 需要建立连接,形成传输数据通道
  • 在连接中进行大数据传递(数据大小不受限制)、
  • 通过三次握手完成连接,是可靠协议,安全送达
  • 必须建立连接,所以效率比较低

Socket

百度百科上的解释

  • Socket的英文原义是“孔”或“插座”。作为BSD UNIX的进程通信机制,取后一种意思。通常也称作"套接字",用于描述IP地址和端口,是一个通信链的句柄。在Internet上的主机一般运行了多个服务软件,同时提供几种服务。每种服务都打开一个Socket,并绑定到一个端口上,不同的端口对应于不同的服务。Socket正如其英文原意那样,像一个多孔插座。一台主机犹如布满各种插座的房间,每个插座有一个编号,有的插座提供220伏交流电, 有的提供110伏交流电,有的则提供有线电视节目。 客户软件将插头插到不同编号的插座,就可以得到不同的服务。

    Socket的作用

  • Socket就是为网络服务提供的一种机制
    • 在Unix中,网络既是Socket,并不局限在TCP/UDP
    • Socket可以用于自定义协议
  • 通信的两端都是Socket
  • 网络通信其实就是Socket间的通信
  • 数据在两个Socket间通过IO传输

    Socket通讯示意图

    Socket网络编程-基础篇

Scoket开发

  • 开发前准备-导入头文件

    #import <sys/socket.h>

    #import <netinet/in.h>

    #import <arpa/inet.h>

  • 函数说明


    1.scoket函数
    ***

    • 函数原型:
      int socket(int domain, int type, int protocol);
    • 参数说明
      • domain: 协议域,又称协议族(family)。常用的协议族有AF_INET、AF_INET6、AF_LOCAL(或称AF_UNIX,Unix域Socket)、AF_ROUTE等。协议族决定了socket的地址类型,在通信中必须采用对应的地址,如AF_INET决定了要用ipv4地址(32位的)与端口号(16位的)的组合、AF_UNIX决定了要用一个绝对路径名作为地址。
      • type:指定Socket类型。常用的socket类型有SOCK_STREAM、SOCK_DGRAM、SOCK_RAW、SOCK_PACKET、SOCK_SEQPACKET等。流式Socket(SOCK_STREAM)是一种面向连接的Socket,针对于面向连接的TCP服务应用。数据报式Socket(SOCK_DGRAM)是一种无连接的Socket,对应于无连接的UDP服务应用。
      • protocol: 指定协议。常用协议有IPPROTO_TCP、IPPROTO_UDP、IPPROTO_SCTP、IPPROTO_TIPC等,分别对应TCP传输协议、UDP传输协议、STCP传输协议、TIPC传输协议。
        注意:type和protocol不可以随意组合,如SOCK_STREAM不可以跟IPPROTO_UDP组合。当第三个参数为0时,会自动选择第二个参数类型对应的默认协议。
    • 返回值
      • 如果调用成功就返回新创建的套接字的描述符,如果失败就返回INVALID_SOCKET(Linux下失败返回-1)。套接字描述符是一个整数类型的值。
    • int clientSocket = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);

      2.connect函数

    • 函数原型:int PASCAL FAR connect( SOCKET s, const struct sockaddr FAR* name, int namelen);
    • 参数说明
      • s:标识一个未连接socket
      • name:指向要连接套接字的sockaddr结构体的指针

        struct sockaddr_in serverAddr;
        serverAddr.sin_family = AF_INET;
        serverAddr.sin_port = htons(12345);
        serverAddr.sin_addr.s_addr = inet_addr("127.0.0.1");

      • namelen:sockaddr结构体的字节长度
    • 返回值
      • 成功则返回0, 失败返回-1, 错误原因存于errno 中。
    • int connResult = connect(clientSocket, (const struct sockaddr *)&serverAddr, sizeof(serverAddr));

      注意:在 C 语言开发中,经常传递一个数据结构的指针同时,需要指定该数据结构的长度


    3.send函数
    ***

    • 函数原型:int send(SOCKET s, const char *buf, int len, int flags);
    • 参数说明
      • SOCKET s:发送端套接字描述符,客户端的socket
      • const char *buf:应用程序要发送的数据的缓冲区(想要发送的数据),发送内容地址
      • int len:实际要发送的字节数
      • int flags:发送方式标识,一般置为0即可
    • 返回值
      • 如果成功,则返回发送的字节数,失败则返回SOCKET_ERROR。
    • NSString *sendMsg = @"Hello";

      ssize_t sendLen = send(clientSocket, sendMsg.UTF8String, strlen(sendMsg.UTF8String), 0);

      同步Socket的send函数的执行流程如下:

      • 调用该函数时,send先比较待发送数据的长度len与套接字s的发送缓冲区的长度(区别于buf),如果len大于s的发送缓冲区的长度,则函数返回SOCKET_ERROR;如果len小于或者等于s发送缓冲区的长度,那么send先检查协议是否正在发送s的发送缓冲区中的数据:

      • a.如果是在发送,就等待协议将数据发送完毕。
      • b.如果没有开始发送s的缓冲区中的数据,那么send就比较s的发送缓冲区的剩余空间和len的大小:
      • 如果len大于发送缓冲区剩余空间大小(不足放入剩余发送缓冲区),send就一直 等待协议把s发送缓冲区中的数据发送完;
      • 如果len小于发送缓冲区剩余空间大小,就仅仅把buf中的数据copy到发送缓冲区的剩余空间里(send函数返回时并不代表send把s的缓冲区的数据(buf)传到连接的另一端,而是协议传输的,send仅仅是把buf中的数据copy到s的发送缓冲区的剩余空间中)。
      • 如果send函数copy数据成功,就返回实际copy的字节数,如果send在copy数据时出现错误,那么send就返回SOCKET_ERROR;如果send在等待协议传送数据时断开网络,那么send函数也返回SOCKET_ERROR。

        要注意send函数把buf中的数据成功copy到s的发送缓冲的剩余空间后就返回了,但是此时这些数据并不一定马上被传到连接的另一端。如果协议在后续的传送过程中出现网络错误的话,那么下一个Socket函数就会返回SOCKET_ERROR.(每一个除send之外的Socket函数在执行的最开始总要先等待套接字的发送缓冲区中的数据被协议传送完毕才能继续,如果在等待时出现网络错误,那么该Socket函数就返回SOCKET_ERROR)。


4.recv函数
***

  • 函数原型:int recv (SOCKET s, char* buf ,int len, int flags);
  • 参数说明
    • SOCKET s:发送端套接字描述符,客户端的socket
    • const char *buf:应用程序存放接收数据的缓冲区
    • int len:buf的实际长度
    • int flags:接收方式标识,0表示阻塞,必须等待服务器返回数据一般置为0即可
  • 返回值
    • 如果成功,则返回接收到的字节数。
  • uint8_t buffer[1024]; // 要把空间准备出来

    ssize_t recvLen = recv(clientSocket, buffer, sizeof(buffer), 0);

同步Socket的recv函数的执行流程如下:
调用recv函数时,recv先等待s的发送缓冲区中的数据被协议发送完毕:

  • a.如果协议在传送s的发送缓冲区中的数据时出现网络错误,那么recv函数返回SOCKET_ERROR;
  • b.如果s的发送缓冲区中的数据被协议成功发送完毕或者没有数据时,recv先检查套接字s的接收缓冲区的情况:
  • 如果s接收缓冲区中没有数据或者协议正在接收数据,那么recv就一直等待,直到协议把数据接收完毕。当协议把数据接收完毕,recv函数就把s的接收缓冲区中的数据copy到buf中(注意协议接收到的数据可能大于buf的长度,所以在这种情况下要调用几次recv函数才能把s的接收缓冲中的数据copy完。recv函数仅仅是copy数据,真正接收数据是协议来完成的),recv函数返回其实际copy的字节数。
    如果recv在copy时出错,那么它返回SOCKET_ERROR;如果recv函数在等待协议接收数据时网络中断了,那么它返回0。


    5.close函数
    ***

    • 函数原型:int close(SOCKET s)
    • 参数说明
      • SOCKET s:发送端套接字描述符,客户端的socket
    • 返回值
      • ???
    • close(clientSocket);

      相关名词解释:
      - 长连接:连上就一直聊!通常用于 QQ,即时通讯,效率高!
      - 短连接:通讯一次,马上断开,下一次再次建立连接,效率低!

  • Socket开发——Netcat

    $ nc -lk 12345

    Netcat:是终端下用于调试和检查网络的工具包,可用于创建 TCP/IP 连接。

  • 上一篇:Py西游攻关之Socket网络编程


    下一篇:1.1 What is the plug-in?