一、I/O流操作一般流程:
(1)为每一个要打开的文件定义一个FILE *类型的指针变量,这个指针变量将指向I/O流使用的FILE结构体。
(2)使用fopen函数打开I/O流。要打开一个I/O流,必须指定要打开的文件(或设备)以及打开后的访问方式(如:只读、只写或读写等)。
(3)按照需要的操作读写文件。
(4)最后,使用fclose函数关闭该I/O流。
在标准流(stdin、stdout和stderr)上进行I/O操作不需要打开和关闭。(stdin、stdout和stderr其实也是执行FILE结构体的指针,它们是由运行时环境提供的)。
I/O函数处理数据的方式分为三种:单字符、文本行和二进制数据。不同的方式使用不同的函数集处理。
二、打开I/O流
1、fopen
FILE *fopen( char const *name, char const *mode );
参数name和mode都是字符串。
参数name是要打开的文件名,参数mode是打开方式(文本打开方式:“r”、“w”、“a”,二进制打开方式:“rb”、“wb”、“ab”)。
函数返回值由之前定义的FILE *类型的变量保存。如果成功,则返回一个指向FILE结构体的指针;如果失败,则返回NULL,并且失败原因代码记录在errno中。
使用“r”方式打开的文件应该已经存在,如果文件不存在则出错。
使用“w”方式打开的文件无论存在还是不存在,都会新建一个name命名的文件(如果存在会先将原来的同名文件删除后再新建)。
使用“a”方式打开的文件如果存在,不删除,打开后位置指针指向移到文件尾,如果文件不存在则新建。
另外,如果在模式字符后加上一个加号“+”,那么无论该模式是只读、只写还是追加,加上加号“+”后都将变为可读写。需要注意的是,当你以可读写的方式打开一个文件进行读写操作时:如果你对该文件进行了读操作,那么在你对该文件开始进行写操作之前必须调用文件定位函数(fseek、fsetpos和rewind);在你对该文件进行了写操作之后,那么在你对该文件开始进行读操作之前必须调用fflush或者文件定位函数。
注意:即便是“r”加上了加号“r+”,虽然由只读变为可读写,但是打开时依然要求文件存在,如果不存在则出错。
提醒:无论何时,只要调用fopen函数,务必要检查其返回值。通常使用fopen的格式如下:
FILE *input; input = fopen( "data3", "r" );
if( input == NULL )
{
perror( "data3" );
exit( EXIT_FAILURE );
}
2、freopen
FILE *freopen( char const *filename, char const *mode, FILE *stream );
freopen函数用来打开(或重新打开)一个文件上的特定的流。
参数stream是将要被打开的流。它可能是之前fopen返回的,也可能是标准流(stdin、stdout、stderr)。
freopen函数首先会关闭参数stream代表的流,然后使用给定的文件filename和模式mode重新打开这个流。如果成功,则返回参数stream的值;如果失败,则返回NULL。
三、关闭I/O流
int fclose( FILE *f );
对于输出流(以“w”方式打开的流),fclose会在关闭该流之前冲刷缓冲区(也就是将缓冲区中的内容写到磁盘文件中)。
成功,则返回0;失败,则返回EOF。
所有有可能会失败的操作都要进行检查,fclose返回值检查格式如下:
if( fclose( input ) != )
{
perror( "fclose" );
exit( EXIT_FAILURE );
}
四、字符I/O
1、字符输入操作使用getchar函数家族中的函数,这些函数原型如下:
int fgetc( FILE *stream );
int getc( FILE *stream );
int getchar( void );
fgetc和getc从指定的流stream中获取要输入的字符,而getchar总是从标准输入中获取要输入的字符。
上面三个函数都是从流中读取下一个字符(当然第一次调用这些函数读的是流中的第一个字符,第二次调用就读第二个字符,以此类推)并且将该字符作为函数返回值。如果流中字符被读取完,后面不再有字符,那么返回EOF。
注意:上述三个函数目的都是读取字符,但是函数返回值不是char而是int,其真正原因是为了使得函数可以报告文件结尾EOF。EOF是被定义为int的,这样EOF就在所有可能的字符集范围之外。
2、字符输出操作使用putchar函数家族中的函数,这些函数原型如下:
int fputc( int character, FILE *stream );
int putc( int character, FILE *stream );
int putchar( int character );
第一个参数是将要打印的字符。上述函数会将int参数截断为unsigned char,然后再打印。
成功的话,上述函数会返回打印的字符;如果出错,上述函数会返回EOF。
3、撤消字符I/O
int ungetc( int character, FILE *stream );
ungetc函数会将character读回到stream中,以便该字符可以被再次读取,并且ungetc将character作为返回值。需要注意的是,已经读取并存储了该字符的变量值不会受到影响。
通过下面的例子可以更直观的理解:
#include <stdio.h>
#include <stdlib.h>
void main()
{
char c1;
char c2;
char c3;
char c4;
char c5;
char c6; c1 = getchar();
c2 = getchar();
c3 = getchar();
c4 = ungetc( c3, stdin );
c5 = getchar();
c6 = getchar(); printf( "c1=%c\n", c1 );
printf( "c2=%c\n", c2 );
printf( "c3=%c\n", c3 );
printf( "c4=%c\n", c4 );
printf( "c5=%c\n", c5 );
printf( "c6=%c\n", c6 );
}
五、非格式化行I/O
面向行的I/O可以有两种处理方式:非格式化和格式化。这两种方式的操作对象都是字符串。区别在于,非格式化行I/O只是简单地读写字符串,而格式化行I/O会对数字和其他变量的内部和外部表示形式进行转换。
gets函数家族和puts函数家族针对字符串进行操作,它们的原型如下:
char *fgets( char *buffer, int buffer_size, FILE *stream );
char *gets( char * buffer ); int fputs( char const *buffer, FILE *stream );
int puts( char const *buffer );
1、fgets
fgets从指定的流stream中读取字符串,并把读到的字符串拷贝到buffer中。读到换行符(newline)并将换行符存储到buffer后停止读取。如果已经读取了buffer_size-1个字符,这时也会停止读取。无论是何种原因导致停止读取,停止读取后都会在buffer末尾添加一个字符串结束符NUL('\0')。
如果什么都还没有读取就读到了文件末尾,那么buffer不会改变,并且fgets会返回指针NULL。否则fgets会返回指向buffer的指针。其返回值经常用来检测是否到达了文件末尾。
2、fputs
传递给fputs的参数buffer必须包含一个字符串,而且这个字符串要以NUL('\0')结尾。这个字符串会被写到参数stream中。对该字符串,fputs是逐个字符进行写入的:如果该字符串中不包含换行符(newline),那么就不会写入换行符;如果该字符串中包含多个换行符,那么这些换行符都会被写入。由此,我们可以看出:fgets是一次尽力去读取一整行;而fputs则可以一次写入一行的一部分、一整行或者多行。
如果发生错误,fputs会返回EOF;否则它会返回一个非负值。
3、gets和puts
gets和puts基本上跟fputs和fgets相同。主要功能上的区别在于:
同fgets相比,gets读取输入流中的一行(以换行符结尾),但是它不会存储换行符(newline):也就是说gets会丢弃换行符,然后再在行尾加上一个NUL('\0')。
同fputs相比,puts在写入字符串时,会在字符串后添加一个换行符(newline)。
注意:gets与fgets的另外一个区别是gets没有buffer_size参数。因此gets无法决定buffer的长度。如果读入的行长度超过了buffer所能容纳的大小,那么将会破坏内存中位于buffer之后的毫不相干的变量。即出现了缓冲区越界,这是很危险的。这是gets函数自身存在的一个漏洞,建议慎重使用该函数。
六、格式化行I/O
1、scanf family
int fscanf( FILE *stream, char const *format, ... );
int scanf( char const *format, ... );
int sscanf( char const *string, char const *format, ... );
简单来说,上面三个输入函数主要区别在于输入源不同:fscanf从stream中输入;scanf从标准输入中输入;sscanf则从字符串string中输入。
当到达格式化字符串format结尾或者读到的输入跟格式化字符串不匹配时,会停止输入。
上述函数会将转换的输入个数作为函数返回值。如果一个输入都还没有转换就读到了文件结尾则返回EOF。
fscanf、scanf以及sscanf都会跳过空白字符(包括空格、Tab和换行等)。
2、printf family
int fprintf( FILE *stream, char const *format, ... );
int printf( char const *format, ... );
int sprintf( char *buffer, char const *format, ... );
简单来讲,printf输出到标准输出;fprintf输出到指定的流stream中;sprintf则将以NUL结尾的字符串输出到指定的buffer中。
七、二进制I/O
fread用来读取二进制数据,fwrite用来写二进制数据。
size_t fread( void *buffer, size_t size, size_t count, FILE *stream );
size_t fwrite( void *buffer, size_t size, size_t count, FILE *stream );
buffer是指向保存二进制数据区域的指针。size表示buffer中每个元素的字节数。count表示要读写多少个这样的元素。stream是要读写的流。
fread和fwrite会返回实际读写的元素个数。这个返回值有可能比count要小(由于读到了文件结尾或者写时出错)。
八、冲刷和定位函数
1、fflush
fflush会强制将输出缓冲区中的内容写入到磁盘文件(或设备)中,即使输出缓冲区还没有满,fflush也会强行将其中的内容冲刷出来到它该去的地方去。
int fflush( FILE *stream );
fflush(NULL) flushes all streams opened for output.
This function is used to flush any data in output stream. So this will compile but its behavior is undefined by the ANSI C standard. The fflush() function is only meant to be used on streams open for output, not input. Both fflush(stdin) and fflush(NULL), in some C libraries, will flush stdout and stderr, but this is completely unportable! Thus, it should not be used.
2、随机访问I/O
要实现随机访问,首先需要定位要访问的位置。以下两个函数就是用来实现文件中位置定位的:
long ftell( FILE *stream );
int fseek( FILE *stream, long offset, int from );
ftell函数会返回I/O流的当前读写位置,它是相对于文件开头的偏移量,也是下次读写的开始位置。对于二进制文件,这个偏移量是从文件开始到当前位置的字节数。然而,在文本文件中,这个偏移量虽然也表示当前位置,但它可能并不是十分精确的表示从文件开头到当前位置的字符数。这是因为行结尾字符在不同系统中可能有所转换。
不过,无论是二进制文件还是文本文件,使用ftell得到的返回值都可以作为fseek中表示相对于文件开头的偏移量。
fseek可以改变下次读写的文件的位置。该位置由参数offset和from共同决定。
from | 将会定位到... |
SEEK_SET | 相对于文件开头offest字节的地方;offset必须为非负。 |
SEEK_CUR | 相对于当前位置offset字节的地方;offset可正可负。 |
SEEK_END | 相对于文件末尾offset字节的地方;offset可正可负。 |
注意:
(1)试图定位到文件开头之前的位置会出错。
(2)定位到文件末尾之后的位置并进行写入操作会扩展文件。
(3)定位到文件末尾之后的位置并进行读取操作会返回文件结束符(end-of-file)。
(4)对于二进制文件,不支持从SEEK_END开始定位,也应避免这样做。
(5)对于文本文件,如果参数from为SEEK_CUR或者SEEK_END,那么offset必须为0。如果参数from为SEEK_SET,那么offset必须是ftell的返回值。
使用fseek改变文件读写位置后会有3个副作用:
(1)文件尾指示符被清除。
(2)如果ungetc在fseek之前调用,那么撤消的字符将被丢弃(下一次读不到该字符,而是读该字符后面的字符)。
(3)可以从读模式切换到写模式。还可以更新打开的流(类似于fflush的功能)。
void rewind( FILE *stream );
int fgetpos( FILE *stream, fpos_t *position );
int fsetpos( FILE *stream, fpos_t const *position );
rewind设置读写指针重新回到文件开头。它还会清除该流的错误标记。
fgetpos与ftell功能相同,fsetpos与fseek功能相同。
九、设置缓冲区
void setbuf( FILE *stream, char *buf );
int setvbuf( FILE *stream, char *buf, int mode, size_t size );
上面两个函数只能在特定的流打开以后,但还没有对该流进行任何其他操作的情况下进行调用。
1、setbuf
setbuf函数的功能是:安装一个数组buf来作为流stream的缓冲区。该数组buf大小必须是BUFSIZ(BUFSIZ在stdio.h中定义)。自己为流指定一个缓冲区后,那么会阻止I/O库动态地为该流分配缓冲区。如果调用setbuf时,参数buf为NULL,那么将会关闭该流的所有缓冲区。
2、setvbuf
setvbuf函数更加通用。参数mode用来指示设置何种类型的缓冲区:_IOFBF(全缓冲)、_IONBF(无缓冲)和_IOLBF(行缓冲)。
使用行缓冲的输出流,每当向缓冲区写入换行符(newline)时就冲刷缓冲区buffer。
参数buf和size是用来指定所用的缓冲区的。如果buf为NULL,那么size必须是0。通常情况下,最好使用一个大小为BUFSIZE的数组作为缓冲区。
十、I/O流错误检查函数
int feof( FILE *stream );
int ferror( FILE *stream );
void clearerr( FILE *stream ):
如果流当前读写指针位于文件尾,那么feof会返回真。函数fseek、rewind或者fsetpos会清除文件尾标识。
如果流发生了任何读写错误,那么ferror会返回真。
clearerr用来重置流的错误状态标识。