C语言文件操作攻略

数据的输入和输出几乎伴随着每个 C 语言程序,所谓输入就是从“源端”获取数据,所谓输出可以理解为向“终端”写入数据。这里的源端可以是键盘、鼠标、硬盘、光盘、扫描仪等输入设备,终端可以是显示器、硬盘、打印机等输出设备。在 C 语言中,把这些输入和输出设备也看作“文件”。

 

文件及其分类

计算机上的各种资源都是由操作系统管理和控制的,操作系统中的文件系统,是专门负责将外部存储设备中的信息组织方式进行统一管理规划,以便为程序访问数据提供统一的方式。

文件是操作系统管理数据的基本单位,文件一般是指存储在外部存储介质上的有名字的一系列相关数据的有序集合。它是程序对数据进行读写操作的基本对象。在 C 语言中,把输入和输出设备都看作文件。

文件一般包括三要素:文件路径文件名后缀

由于在 C 语言中 '\' 一般是转义字符的起始标志,故在路径中需要用两个 '\' 表示路径中目录层次的间隔,也可以使用 '/' 作为路径中的分隔符。

例如,"E:\\ch10.doc"或者"E:/ch10.doc",表示文件 ch10.doc 保存在 E 盘根目录下。"f1.txt" 表示当前目录下的文件 f1.txt。

文件路径:可以显式指出其绝对路径,如上面的”E:\\”或者”E:/”等;如果没有显式指出其路径,默认为当前路径。

C 语言不仅支持对当前目录和根目录文件的操作,也支持对多级目录文件的操作,例如:

D:\\C_WorkSpace\\Chapter_10\\file_1.txt

或者

D:/C_WorkSpace/Chapter_10/file_1.txt

中的 file_1.txt 均是 C 语言可操作的多级目录文件。

文件名:标识文件名字的合法标识符,如 ch10、file_1 等都是合法的文件名。

后缀:一般用于标明文件的类型,使用方式为:文件名.后缀,即文件名与后缀之间用 '.' 隔开。常见的后缀类型有:doc、txt、dat、c、cpp、obj、exe、bmp、jpg 等。

C 语言中的输入和输出都是和文件相关的,即程序从文件中输入(读取)数据,程序向文件中输出(写入)数据。

文件按其逻辑结构可分为:记录文件流式文件。而记录文件又可分为:顺序文件、索引文件、索引顺序文件散列文件等。

流式文件是以字节为单位,对流式文件的访问一般采用穷举搜索的方式,效率不高,故一般需频繁访问的较大数据不适宜采用流式文件逻辑结构。但由于流式文件管理简单,用户可以较方便地对文件进行相关操作。

 

 

 

 

 

流的概念及分类

I/O 设备的多样性及复杂性,给程序设计者访问这些设备带来了很大的难度和不便。为此,ANSIC 的 I/O 系统即标准 I/O 系统,把任意输入的源端或任意输出的终端,都抽象转换成了概念上的“标准 I/O 设备”或称“标准逻辑设备”。程序绕过具体设备,直接与该“标准逻辑设备”进行交互,这样就为程序设计者提供了一个不依赖于任何具体 I/O 设备的统一操作接口,通常把抽象出来的“标准逻辑设备”或“标准文件”称作“流”

把任意 I/O 设备,转换成逻辑意义上的“标准 I/O 设备”或“标准文件”的过程,并不需要程序设计者感知和处理,是由标准 I/O 系统自动转换完成的。故从这个意义上,可以认为任意输入的源端和任意输出的终端均对应一个“流”。

流按方向分为:输入流输出流。从文件获取数据的流称为输入流,向文件输出数据称为输出流。

例如,从键盘输入数据然后把该数据输出到屏幕上的过程,相当于从一个文件输入流(与键盘相关)中输入(读取)数据,然后通过另外一个文件输出流(与显示器相关)把获取的数据输出(写入)到文件(显示器)上。

流按数据形式分为:文本流和二进制流。文本流是 ASCII 码字符序列,而二进制流是字节序列。

 

 

 

 

 

 

文本文件与二进制文件

根据文件中数据的组织形式的不同,可以把文件分为:文本文件二进制文件

  • 文本文件:把要存储的数据当成一系列字符组成,把每个字符的 ASCII 码值存入文件中。每个 ASCII 码值占一个字节,每个字节表示一个字符。故文本文件也称作字符文件或 ASCII 文件,是字符序列文件。
  • 二进制文件:把数据对应的二进制形式存储到文件中,是字节序列文件。


例如数据 123,如果按文本文件形式存储,把数据看成三个字符:'1'、'2'、'3' 的集合,文件中依次存储各个字符的 ASCII 码值,格式如表 1 所示。

表 1 数据 123 的文本存储形式
字符 '1' '2' '3'
ASCII(十进制) 49 50 51
ASCII(二进制) 0011 0001 0011 0010 0011 0011


如果按照二进制文件形式存储,则把数据 123 看成整型数,如果该系统中整型数占 4 个字节,则数据 123 二进制存储形式的 4 个字节如下。

0000 0000 0000 0000 0000 0000 0111 1011

 

 

 

 

文件的打开与关闭

打开函数 fopen 的原型如下。

FILE * fopen(char *filename, char *mode);

函数参数:

1.filename:文件名,包括路径,如果不显式含有路径,则表示当前路径。例如,“D:\\f1.txt”表示 D 盘根目录下的文件 f1.txt 文件。“f2.doc”表示当前目录下的文件 f2.doc。

2.mode:文件打开模式,指出对该文件可进行的操作。常见的打开模式如 “r” 表示只读,“w” 表示只写,“rw” 表示读写,“a” 表示追加写入。更多的打开模式如表 2 所示。

表 2
模式 含 义 说 明
r 只读 文件必须存在,否则打开失败
w 只写 若文件存在,则清除原文件内容后写入;否则,新建文件后写入
a 追加只写 若文件存在,则位置指针移到文件末尾,在文件尾部追加写人,故该方式不 删除原文件数据;若文件不存在,则打开失败
r+ 读写 文件必须存在。在只读 r 的基础上加 '+' 表示增加可写的功能。下同
w+ 读写 新建一个文件,先向该文件中写人数据,然后可从该文件中读取数据
a+ 读写 在” a”模式的基础上,增加可读功能
rb 二进制读 功能同模式”r”,区别:b表示以二进制模式打开。下同
wb 二进制写 功能同模式“w”。二进制模式
ab 二进制追加 功能同模式”a”。二进制模式
rb+ 二进制读写 功能同模式"r+”。二进制模式
wb+ 二进制读写 功能同模式”w+”。二进制模式
ab+ 二进制读写 功能同模式”a+”。二进制模式


返回值:打开成功,返回该文件对应的 FILE 类型的指针;打开失败,返回 NULL。故需定义 FILE 类型的指针变量,保存该函数的返回值。可根据该函数的返回值判断文件打开是否成功。

 

关闭函数 fclose 的原型如下。

int fclose(FILE *fp);

函数参数:
fp:已打开的文件指针。

返回值:正常关闭,返回否则返回 EOF(-1)。

例如:

             C语言文件操作攻略

 

 

 

 

文件的顺序读写

换字符输入输出

c 语言中提供了从文件中逐个输入字符及向文件中逐个输出字符的顺序读写函数 fgetc 和 fputc 及调整文件读写位置到文件开始处的函数 rewind。这些函数均在标准输入输出头文件 stdio.h 中。

字符输入函数 fgetc 的函数原型为:

int fgetc (FILE *fp);

所在头文件:<stdio.h>。

函数功能:从文件指针 fp 所指向的文件中输入一个字符。输入成功,返回该字符;已读取到文件末尾,或遇到其他错误,即输入失败,则返回文本文件结束标志 EOF(EOF 在 stdio.h 中已定义,一般为 -1)。

注意:由于 fgetc 是以 unsigned char 的形式从文件中输入(读取)一个字节,并在该字节前面补充若干 0 字节,使之扩展为该系统中的一个 int 型数并返回,而非直接返回 char 型。当输入失败时返回文本文件结束标志 EOF 即 -1,也是整数。故返回类型应为 int 型,而非 char 型。

如果误将返回类型定义为 char 型,文件中特殊字符的读取可能会出现意想不到的逻辑错误。

由于在 C 语言中把除磁盘文件外的输入输出设备也当成文件处理,故从键盘输入字符不仅可以使用宏 getchar() 实现,也可以使用 fgetc (stdin) 实现。其中,stdin 指向标准输入设备—键盘所对应的文件。stdin 不需要人工调用函数 fopen 打开和 fclose 关闭。

字符输出函数 fputc 的函数原型为:

int fputc (int c, FILE *fp);

所在头文件:<stdio.h>

函数功能:向 fp 指针所指向的文件中输出字符 c,输出成功,返回该字符;输出失败,则返回 EOF(-1)。

向标准输出设备屏幕输出字符变量 ch 中保存的字符,不仅可以使用宏 putchar(ch) 实现,也可以使用 fputc (ch,stdout); 实现。其中,stdout 指向标准输出设备—显示器所对应的文件。stdout 也不需要人工调用函数 fopen 打开和 fclose 关闭。

对一个文件进行读写操作时,经常会把一个文件中读写位置重新调整到文件的开始处,可以使用函数 rewind 实现。

文件读写位置复位函数 rewind 的函数原型为:

void rewind (FILE *fp);

所在头文件:<stdio.h>

函数功能:把 fp 所指向文件中的读写位置重新调整到文件开始处。

【例 1】从键盘输入若干个字符,同时把这些字符输出到 D 盘根目录下的文件 data_file.txt 中及屏幕上。各个字符连续输入,最后按下回车键结束输入过程。

            C语言文件操作攻略

 

输出结果为:
请输入字符,按回车键结束:I love C
I love C

此时,查看 D 盘根目录下生成的 data_file.txt 文件,并且其内容为 I love C。

 

接字符串输入输出

下面主要介绍文件中常见的字符串输入、输出函数 fgets 和 fputs。

字符串输入函数 fgets 的函数原型为:

char * fgets (char *s, int size, FILE * fp);

所在头文件:<stdio.h>

函数功能:从 fp 所指向的文件内,读取若干字符(一行字符串),并在其后自动添加字符串结束标志 '\0' 后,存入 s 所指的缓冲内存空间中(s 可为字符数组名),直到遇到回车换行符或已读取 size-1 个字符或已读到文件结尾为止。该函数读取的字符串最大长度为 size-1。

参数 fp:可以指向磁盘文件或标准输入设备 stdin。

返回值:读取成功,返回缓冲区地址 s;读取失败,返回 NULL。

说明:fgets 较之 gets 字符串输入函数是比较安全规范的。因为 fgets 函数可由程序设计者自行指定输入缓冲区 s 及缓冲区大小 size。即使输入的字符串长度超过了预定的缓冲区大小,也不会因溢出而使程序崩溃,而是自动截取长度为 size-1 的串存入 s 指向的缓冲区中。
 
字符串输出函数 fputs 的函数原型为:

int fputs (const char *str, FILE *fp);

所在头文件:<stdio.h>

函数功能:把 str(str 可为字符数组名)所指向的字符串,输出到 fp 所指的文件中。

返回值:输出成功,返回非负数;输出失败,返回EOF(-1)。

【例 2】从键盘输入若干字符串存入 D 盘根目录下文件 file.txt 中,然后从该文件中读取所有字符串并输出到屏幕上。

            C语言文件操作攻略

 

运行结果为:
请输入3个字符串:
字符串1:How are you going today?
字符串2:Never speak die.
字符串3:Good job!
How are you going today?
Never speak die.
Good job!

此时,D 盘目录下已生成 file.txt 文件,其内容同输出结果完全相同。

 

按格式化输入输出

文件操作中的格式化输入输出函数 fscanf 和 fprintf 一定意义上就是 scanf 和 printf 的文本版本。程序设计者可根据需要采用多种格式灵活处理各种类型的数据,如整型、字符型、浮点型、字符串、自定义类型等。

文件格式化输入函数 fscanf 的函数原型为:

int fscanf (文件指针,格式控制串,输入地址表列);

所在头文件:<stdio.h>

函数功能:从一个文件流中执行格式化输入,当遇到空格或者换行时结束。注意该函数遇到空格时也结束,这是其与 fgets 的区别,fgets 遇到空格不结束。

返回值:返回整型,输入成功时,返回输入的数据个数;输入失败,或已读取到文件结尾处,返回 EOF(-1)。

故一般可根据该函数的返回值是否为 EOF 来判断是否已读到文件结尾处。

例如,若文件 f1.dat 中保存了若干整数,各整数之间用空格间隔,从文件中读取两个整数,依次保存到两个整型变量中。程序代码段如下。

           C语言文件操作攻略

 

 

文件格式化输出函数 fprintf 的函数原型为:

int fprintf (文件指针,格式控制串,输出表列);

所在头文件:<stdio.h>

函数功能:把输出表列中的数据按照指定的格式输出到文件中。

返回值:输出成功,返回输出的字符数;输出失败,返回一负数。

例如,向当前目录文件file.txt中输入一个学生的姓名、学号和年龄,采用文本方式,参考代码如下。

          C语言文件操作攻略

 

 运行程序后,当前目录下生成了 file.txt 文件,并且其内容为:
张三  20170304007  17

 

 

 

 

按二进制方式读写数据块

接下来介绍按块读写数据的函数 fread 和 fwrite,这两个函数主要应用于对二进制文件的读写操作,不建议在文本文件中使用。接着介绍了 fread 读取二进制文件时,判断是否已经到达文件结尾的函数 feof。

数据块读取(输入)函数 fread 的函数原型为:

unsigned fread (void *buf, unsigned size, unsigned count, FILE* fp);

所在头文件:<stdio.h>

函数功能:从 fp 指向的文件中读取 count 个数据块,每个数据块的大小为 size。把读取到的数据块存放到 buf 指针指向的内存空间中。

返回值:返回实际读取的数据块(非字节)个数,如果该值比 count 小,则说明已读到文件尾或有错误产生。这时一般采用函数 feof 及 ferror 来辅助判断。

函数参数:

  • buf:指向存放数据块的内存空间,该内存可以是数组空间,也可以是动态分配的内存。void类型指针,故可存放各种类型的数据,包括基本类型及自定义类型等。
  • size:每个数据块所占的字节数。
  • count:预读取的数据块最大个数。
  • fp:文件指针,指向所读取的文件。


数据块写入(输出)函数 fwrite 的函数原型为:

unsigned fwrite (const void *bufAunsigned size,unsigned count,FILE* fp);

所在头文件:<stdio.h>

函数功能:将 buf 所指向内存中的 count 个数据块写入 fp 指向的文件中。每个数据块的大小为 size。

返回值:返回实际写入的数据块(非字节)个数,如果该值比 count 小,则说明 buf 所指空间中的所有数据块已写完或有错误产生。这时一般采用 feof 及 ferror 来辅助判断。

函数参数:

  • buf:前加const的含义是buf所指的内存空间的数据块只读属性,避免程序中有意或无意的修改。
  • size:每个数据块所占的字节数。
  • count:预写入的数据块最大个数。
  • fp:文件指针,指向所读取的文件。

注意:使用 fread 和 fwrite 对文件读写操作时,一定要记住使用“二进制模式”打开文件,否则,可能会出现意想不到的错误。

在操作文件时,经常使用 feof 函数来判断是否到达文件结尾。

feof 函数的函数原型为:

int feof (FILE * fp);

所在头文件:<stdio.h>

函数功能:检查 fp 所关联文件流中的结束标志是否被置位,如果该文件的结束标志已被置位,返回非 0 值;否则,返回 0。

需要注意的是:
1) 在文本文件和二进制文件中,均可使用该函数判断是否到达文件结尾。

2) 文件流中的结束标志,是最近一次调用输入等相关函数(如 fgetc、fgets、fread 及 fseek 等)时设置的。只有最近一次操作输入的是非有效数据时,文件结束标志才被置位;否则,均不置位。

【例 3】从键盘输入若干名学生的姓名、学号、语数外三门课成绩并计算平均成绩,将这些学生信息以二进制方式保存到当前目录文件 Stia_Info.dat 中。采用 fwrite 函数写入数据。存储空间要求采用数组形式。采用静态数组形式,仅为了复习数组作为函数参数的情况,且便于理解,实际编程中不建议采用这种方案

实现代码为:

          C语言文件操作攻略

由于采用二进制形式存储,故打开生成的二进制文件 Stu_Info.dat 可能是“乱码”。通过判断文件的生成以及文件中部分显示正常的数据,可判断代码是否运行正确。

 

 

 

 

文件的随机读写

以上介绍的都是文件的顺序读写操作,即每次只能从文件头开始,从前往后依次读写文件中的数据。在实际的程序设计中,经常需要从文件的某个指定位置处开始对文件进行选择性的读写操作,这时,首先要把文件的读写位置指针移动到指定处,然后再进行读写,这种读写方式称为对文件的随机读写操作。

C 语言程序中常使用 rewind、fseek 函数移动文件读写位置指针。使用 ftell 获取当前文件读写位置指针。

函数 fseek 的函数原型为:

int fseek(FI:LE *fp, long offset, int origin);

所在头文件:<stdio.h>

函数功能:把文件读写指针调整到从 origin 基点开始偏移 offset 处,即把文件读写指针移动到 origin+offset 处。

函数参数:

1) origin:文件读写指针移动的基准点(参考点)。基准位置 origin 有三种常量取值:SEEK_SET、SEEK_CUR 和 SEEK_END,取值依次为 0,1,2。

SEEK_SET:文件开头,即第一个有效数据的起始位置。
SEEK_CUR:当前位置。
SEEK_END:文件结尾,即最后一个有效数据之后的位置。注意:此处并不能读取到最后一个有效数据,必须前移一个数据块所占的字节数,使该文件流的读写指针到达最后一个有效数据块的起始位置处。

2) offset:位置偏移量,为 long 型,当 offset 为正整数时,表示从基准 origin 向后移动 offset 个字节的偏移;若 offset 为负数,表示从基准 origin 向前移动 |offset| 个字节的偏移。

返回值:成功,返回 0;失败,返回 -1。

例如,若 fp 为文件指针,则 seek (fp,10L,0); 把读写指针移动到从文件开头向后 10 个字节处。 fSeek(fp,10L,1); 把读写指针移动到从当前位置向后 10 个字节处。 fseek(fp,-20L,2); 把读写指针移动到从文件结尾处向前 20 个字节处。

调用 fseek 函数时,第三个实参建议不要使用 0、1、2 等数字,最好使用可读性较强的常量符号形式,使用如下格式取代上面三条语句。

fseek(fp,10L,SEEK_SET);
fseek(fp,10L,SEEK_CUR);
fseek(fp,-20L,SEEK_END);

 

函数 ftell 的函数原型:

long ftell (FILE *fp);

所在头文件:<stdio.h>

函数功能:用于获取当前文件读写指针相对于文件头的偏移字节数。

例如,分析以下程序,输出其运行结果。

          C语言文件操作攻略

运行结果为:
名字    年龄    职务
闪电    10      车管所职工
尼克    8       协警
兔朱迪  5       交通警察

 

上一篇:C语言fgets和fputs函数的用法详解(以字符串的形式读写文件)


下一篇:通过import keyword查看python中定义的关键字