Linux IO函数的使用和区别

2023-08-15 12:45:58

Linux系统中的IO函数主要有read、write、recv、send、recvmsg、sendmsg、readv、writev，本篇主要介绍他们的使用以及区别。

read函数：

#include <unistd.h>
ssize_t read(int fd,void *buf,size_t count);

read函数从文件描述符fd对应的文件中，读取count字节，放在buf缓冲区。如果count为0，read返回为0，不进行其他操作；如果count的值大于SSIZE_MAX,结果不能预料。在读取成功的时候，文件对应的读取位置指针，，向后移动位置，大小为成功读取的字节数。

如果read执行成功，访回读取的字节数；当返回为-1时候，读取函数有错误发生。如果已经达到文件的末尾，返回0；其中，ssize数据类型是不同于int、long类型，它是符号数，具体实现时，可能是int，也可能是long。

write函数：

#include <unistd.h>
ssize_t write(int fd,const void *buf,size_t count);

参数含义与read类似。

recv函数：

#include <sys/types.h>
#include <sys/socket.h>
ssize_t recv(int s,void *buf,size_t len,int flags);

recv函数用于接受数据，该函数从套接字s中接收数据放到缓冲区buf中，buf长度为len，操作的方式由flags指定，第一个参数s是套接字文件描述符，它是由系统调用socket函数返回。第二个参数buf是一个指针，指向接收网络的缓冲区。第三个参数len表示缓冲区的大小，以字节为单位。第四个参数flags用于设置接收数据的方式：

recv()函数flasgs的值及含义
MSG_DONTWAIT	非阻塞，立即返回，不等待
MSG_ERRQUEUE	错误消息从套接字错误队列中接收
MSG_OOB	接收外部数据
MSG_PEEK	查看数据，不进行数据缓冲区的清空
MSG_TRUNC	返回所有数据，即使指定的缓冲区过小
MSG_WAITALL	等待所有消息

MSG_DONTWAIT：这个标志将单个IO操作设为非阻塞，而不需要在套接字上打开非阻塞标志，执行IO，然后关闭非阻塞标志。

MSG_ERRQUEUE：该错误的传输依赖于所使用的协议。

MSG_OOB：这个标志可以接收带外的数据，而不是接收一般数据。

MSG_PEEK：这标志查看可读的数据，在recv函数执行后，内核不会将这些数据丢弃。

MSG_TRUNC：在接收数据后，如果用户的缓冲区大小不足以完全复制缓冲区里的数据，则将数据截掉，仅靠复制用户缓冲区大小的数据，其他的数据将丢弃。

MSG_WAITALL：告诉内核在没有读到请求的字节数之前不要读操作返回。如果系统支持这个标志，可以去掉readn()函数而用下面的替代：

#define readn(fd,ptr,n) recv(fd,ptr,n,MSG_WAITALL).

即使设置了MSG_WAITALL，如果发生以下情况：a扑捉一个信号；b连接终止；c在套接字上发生错误，这个函数返回的字节数仍然比请求的少。

当指定MSG_WAITALL标志时，函数会复制与用户指定的长度相等的数据。如果内核中的数据不能满足要求，会一直等待到数据足够的时候才返回。

函数recv()的返回值是成功接收到的字节数，当返回值为-1时错误发生。

recv函数errno的值及含义
EAGAIN	套接字定义为非阻塞，而操作采用了阻塞方式；或者定义了超时时间到了，而没有接收到数据
EBADF	参数s不是合法的描述符
ECONNREFUSED	远程主机不允许此操作
EFAULT	接收缓冲区的指针，在此进程之外
EINTR	接收到中断信号
EINVAL	传递了不合法的参数
ENOTCONN	套接字s表示流式套接字，此套接字没有连接
ENOTSOCK	参数不是套接字描述符

recv()通常用于TCP，UDP使用recvfrom函数接收数据，当然在数据报套接字绑定了地址和端口后，也可以使用recv函数接收数据。

recv()从内核的接收缓冲区中复制数据到用户指定的缓冲区，当内核中的数据比指定的缓冲区小时，一般情况下（没有采用MSG_WAITALL标志）会复制缓冲区中的所有数据到用户缓冲区，并返回数据的长度。当内核中的数据比指定的缓冲区多时，会将用户指定的长度的接收缓冲区中的数据复制到用户指定地址，其余的数据需要下次调用接收函数时再复制，内核在复制用户指定的数据后，会销毁已经复制完毕的数据，并进行调整。

send函数：

#include <sys/types.h>

#include <sys/socket.h>

ssize_t send(int s,const void*buf,size_t len,int flags);

send函数将缓冲区buf中的大小为len的数据，通过套接字文件描述符s按照flasg指定的方式发生出去（其中的含义与recv()中一致），它的返回值是成功发生的字节数。

由于用户缓冲区buf中的数据通过send发送，不一定能够全部发送出去，所以要检查send()返回值。当send()的返回值小于len时，表面缓冲区中仍有部分数据没有发送成功，这时需要重新发送剩余部分的数据。通常的剩余数据发送方式是对原来的buf中的数据位置进行偏移，偏移的大小为已经发送成功的字节数。

当send()返回-1时，就错误了。

函数send()只能用于套接字处于连接状态的描述符，之前必须用connect()函数或者其他函数进行连接。对于send和write之间的差别是表示发送方式flag，当flag为0时，send()和write()完全一样的，且send(s,buf,len,flags)和sendto(s,buf,len,flags,NULL,0)是等价的。

readv函数:

#include <sys/uio.h>

ssize_t readv(int s,const struct iovec*vector,int count);

read()可以接收多个缓冲区的数据。readv函数从套接字描述符s中读取count块的数据放在缓冲区向量vector中。返回值为成功接收到的数据的字节数，当-1时，错误发生。

其中的参数vector为一个向量的指针，结构struct iover在文件<sys/uio.h>定义：

 struct iovec

 {

     void*iov_base;                             // 向量的缓冲区地址

     size_t iov_len;                             // 大小，字节为单位

 }

在调用readv的时候必须指定iovec的iov_len长度，将值放在iov_len中。参数vector指向一块结构vector的内存，大小count定。如下图，其中阴影部分是需要设置的。

writev函数：

#include <sys/uio.h>

ssize_t writev(int s,const struct iovec*vector,int count);

//// 是不是觉得和readv一样

总结：

码农公寓

相关文章