目录
什么是文件
磁盘上的文件是文件。
但是在程序设计中,我们一般谈的文件有两种:程序文件、数据文件。
程序文件
包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows环境后缀为.exe)。数据文件
文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件。
我们没有学习文件操作之前,大部分见过所处理数据的输入输出都是以终端为对象的,即从终端的键盘输入数据,运行结果显示到显示器上。
其实有时候我们会把信息输出到磁盘上,当需要的时候再从磁盘上把数据读取到内存中使用,这里处理的就是磁盘上文件。
文件名
一个文件要有一个唯一的文件标识,以便用户识别和引用。
文件名包含3部分:文件路径+文件名主干+文件后缀
例如: c:\code\test.txtc:\code\:文件路径
test:文件主干
.test文件后缀
为了方便起见,文件标识常被称为文件名
文件类型
根据数据的组织形式,数据文件被称为文本文件或者二进制文件。
数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是二进制文件。
如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件。
一个数据在内存中是怎么存储的呢?
字符一律以ASCII形式存储,数值型数据既可以用ASCII形式存储,也可以使用二进制形式存储。
如有整数10000,如果以ASCII码的形式输出到磁盘,则磁盘中占用5个字节(每个字符一个字节),而二进制形式输出,则在磁盘上只占4个字节(VS2019测试)。
测试代码:
#include <stdio.h>
int main()
{
int a = 10000;
FILE* pf = fopen("test.txt", "wb");
fwrite(&a, 4, 1, pf);//二进制的形式写到文件中
fclose(pf);
pf = NULL;
return 0;
}
运行完之后:
第一步:
第二步:
结果如下:
文件缓冲区
ANSIC 标准采用“缓冲文件系统”处理的数据文件的,所谓缓冲文件系统是指系统自动地在内存中为程序中每一个正在使用的文件开辟一块“文件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓冲区的大小根据C编译系统决定的。
文件指针
缓冲文件系统中,关键的概念是“文件类型指针”,简称“文件指针”。
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。这些信息是保存在一个结构体变量中的。该结构体类型是有系统声明的,取名FILE.
例如,VS2008编译环境提供的 stdio.h 头文件中有以下的文件类型申明:
struct _iobuf {
char *_ptr;
int _cnt;
char *_base;
int _flag;
int _file;
int _charbuf;
int _bufsiz;
char *_tmpfname;
};
typedef struct _iobuf FILE;
不同的C编译器的FILE类型包含的内容不完全相同,但是大同小异。
每当打开一个文件的时候,系统会根据文件的情况自动创建一个FILE结构的变量,并填充其中的信息,使用者不必关心细节。一般都是通过一个FILE的指针来维护这个FILE结构的变量,这样使用起来更加方便。
下面我们可以创建一个FILE*的指针变量:
FILE* pf;//文件指针变量
定义pf是一个指向FILE类型数据的指针变量。可以使pf指向某个文件的文件信息区(是一个结构体变量)。通过该文件信息区中的信息就能够访问该文件。也就是说,通过文件指针变量能够找到与它关联的文件。
比如:
文件的打开和关闭
文件在读写之前应该先打开文件,在使用结束之后应该关闭文件。
在编写程序的时候,在打开文件的同时,都会返回一个FILE*的指针变量指向该文件,也相当于建立了指针和文件的关系。
ANSIC 规定使用fopen函数来打开文件,fclose来关闭文件。
FILE * fopen ( const char * filename, const char * mode );
int fclose ( FILE * stream );
打开方式如下:
举个栗子:
#include<stdio.h>
#include<stdlib.h>
int main()
{
FILE* pf = fopen("test.txt", "w"); //打开文件
if (pf == NULL)
{
printf("fopen fail\n");
exit(-1);
}
fputs("hello world!", pf);
fclose(pf); //关闭文件
pf=NULL;
return 0;
}
文件的顺序读写
输入流代表读文件。
输出流代表写文件。
fgetc
使用方法:
#include<stdio.h>
#include<stdlib.h>
int main()
{
FILE* pf = fopen("test.txt", "r"); //打开文件
if (pf == NULL)
{
printf("fopen fail\n");
exit(-1);
}
char ch=fgetc(pf);
printf("%c", ch);
fclose(pf); //关闭文件
pf=NULL;
return 0;
}
运行结果:
fgetc(pf); pf代表文件指针,可以一次读取一个字符。
fputc
使用方法:
#include<stdio.h>
#include<stdlib.h>
int main()
{
FILE* pf = fopen("test.txt", "w"); //打开文件
if (pf == NULL)
{
printf("fopen fail\n");
exit(-1);
}
fputc('b', pf);
fputc('i', pf);
fputc('t', pf);
fclose(pf); //关闭文件
pf=NULL;
return 0;
}
运行完之后,打开对应工程下的文件:
fputc('b', pf);
fputc('i', pf);
fputc('t', pf);将字符写到文件指针中去。
fgets
使用方法:
#include<stdio.h>
#include<stdlib.h>
int main()
{
FILE* pf = fopen("test.txt", "r"); //打开文件
if (pf == NULL)
{
printf("fopen fail\n");
exit(-1);
}
char arr[20] = { 0 };
fgets(arr, 20, pf);
printf("%s", arr);
fclose(pf); //关闭文件
pf=NULL;
return 0;
}
char *fgets( char *string, int n, FILE *stream );
char *string:代表指针,可以接收地址,在这里我们定义一个数组,将数组名传过去。
int n:一次可以最多读取字符的个数。
FILE *stream:文件指针。
fputs
使用方法:
#include<stdio.h>
#include<stdlib.h>
int main()
{
FILE* pf = fopen("test.txt", "w"); //打开文件
if (pf == NULL)
{
printf("fopen fail\n");
exit(-1);
}
fputs("hello word!", pf);
fclose(pf); //关闭文件
pf=NULL;
return 0;
}
int fputs( const char *string, FILE *stream );
const char *string:要写的字符串
FILE *stream:文件指针
程序运行完之后来到当前工程目录下来看结果:
fprintf
使用方法:
#include<stdio.h>
#include<stdlib.h>
struct S
{
int n;
double d;
};
int main()
{
struct S s = { 10,3.14 };
FILE* pf = fopen("test.txt", "w"); //打开文件
if (pf == NULL)
{
printf("fopen fail\n");
exit(-1);
}
//写文件
fprintf(pf, "%d %lf", s.n, s.d);
fclose(pf); //关闭文件
pf=NULL;
return 0;
}
int fprintf( FILE *stream, const char *format [, argument ]...);
FILE *stream:文件指针
const char *format:成员类型 %d %lf......
argument ]...::变量,具体内容
运行完后来到该工程的路径下,结果如下:
fscanf
使用方法:
#include<stdio.h>
#include<stdlib.h>
struct S
{
int n;
double d;
};
int main()
{
struct S s = { 0 };
FILE* pf = fopen("test.txt", "r"); //打开文件
if (pf == NULL)
{
printf("fopen fail\n");
exit(-1);
}
//读文件
fscanf(pf, "%d %lf", &(s.n), &(s.d));
printf("%d %lf", s.n, s.d);
fclose(pf); //关闭文件
pf=NULL;
return 0;
}
int fscanf( FILE *stream, const char *format [, argument ]... );
FILE *stream:文件指针
const char *format:成员类型
argument ]...:变量
运行完结果如下:
fwrite
使用方法:
#include<stdio.h>
#include<stdlib.h>
struct S
{
int n;
double d;
char name[10];
};
int main()
{
struct S s = { 10,3.14 ,"zhangsan" };
FILE* pf = fopen("test.txt", "wb"); //二进制形式写文件
if (pf == NULL)
{
printf("fopen fail\n");
exit(-1);
}
//写文件 --- 二进制形式写文件
fwrite(&s, sizeof(s), 1, pf);
fclose(pf); //关闭文件
pf=NULL;
return 0;
}
size_t fwrite( const void *buffer, size_t size, size_t count, FILE *stream );
const void *buffer:指向被写的数据
size_t size:被写的数据的大小,单位是字节
FILE *stream:文件指针
运行完在该工程下的结果:
由于这是以二进制形式写的文件,所以用文本是看不懂的。
fread
使用方法:
#include<stdio.h>
#include<stdlib.h>
struct S
{
int n;
double d;
char name[10];
};
int main()
{
struct S s = { 0 };
FILE* pf = fopen("test.txt", "rb"); //二进制形式读文件
if (pf == NULL)
{
printf("fopen fail\n");
exit(-1);
}
//读文件 --- 二进制形式读文件
fread(&s, sizeof(s), 1, pf);
//打印
printf("%d %lf %s", s.n, s.d, s.name);
fclose(pf); //关闭文件
pf = NULL;
return 0;
}
size_t fread( void *buffer, size_t size, size_t count, FILE *stream );
void *buffer:接收数据的地方
size_t size:数据的大小,单位是字节
size_t count:读取数据的次数, Maximum number of items to be read
运行结果:
sprintf
使用方法:
#include<stdio.h>
#include<stdlib.h>
struct S
{
int n;
double d;
char name[10];
};
int main()
{
char arr[100] = { 0 };
struct S tmp = { 0 };
struct S s = { 100,3.14,"zhangsan" };
//把一个格式化的数据转换成字符串
sprintf(arr, "%d %lf %s", s.n, s.d, s.name);
//打印
printf("%s", arr);
return 0;
}
int sprintf( char *buffer, const char *format [, argument] ... );
char *buffer:存储转换的字符串的地方
const char *format:被转换的格式化数据的类型
argument] ...:格式化数据
运行结果:
sscanf
使用方法:
#include<stdio.h>
#include<stdlib.h>
struct S
{
int n;
double d;
char name[10];
};
int main()
{
char arr[100] = { 0 };
struct S tmp = { 0 };
struct S s = { 100,3.14,"zhangsan" };
//把一个格式化的数据转换成字符串
sprintf(arr, "%d %lf %s", s.n, s.d, s.name);
//从arr中的字符串提取出一个格式化的数据
sscanf(arr, "%d %lf %s", &(tmp.n), &(tmp.d), tmp.name);
//打印
printf("%d %lf %s", tmp.n, tmp.d, tmp.name);
return 0;
}
int sscanf( const char *buffer, const char *format [, argument ] ... );
const char *buffer:存储数据的地方
const char *format :要转换成格式化数据的类型
argument ] ...:Optional arguments
运行结果如下:
注意:
sprintf和sscanf打印的结果是一样的,但是意义并不一样。
前者打印的是字符串,后者打印的是格式化的数据。
对比一组函数
scanf:从标准输入流(键盘)读取格式化的数据。
fscanf:从所有的输入读取格式化的数据。
sscanf:从字符串中读取一个格式化的数据 //把一个字符串转换成格式化的数据。
printf:把格式化的数据输出到标准输出(屏幕)上。
fprintf:从所有的输入流读取格式化的数据。
sprintf:把格式化的数据转换成对应的字符串。
文件的随机读写
fseek
根据文件指针的位置和偏移量来定位文件指针。
int fseek( FILE *stream, long offset, int origin );FILE *stream:文件指针名
long offset:相对于起始位置的偏移量
int origin:默认的起始位置
使用方法:
#include<stdio.h>
#include<stdlib.h>
int main()
{
FILE* pf = fopen("test.txt", "rb");
if (pf == NULL)
{
printf("fopen fail\n");
exit(-1);
}
fseek(pf, 2, SEEK_SET);
char ch = fgetc(pf);
printf("%c\n", ch);
fclose(pf);
pf = NULL;
return 0;
}
在代码运行前我们提前在对应的文件夹内输入一串字符串(以下的代码都是这样的):
代码:fseek(pf, 2, SEEK_SET);
是不是对SEEK_SET感到很疑惑?别急,接着往下看。
3个关于定位文件指针偏移的函数
SEEK_CUR :文件指针指向当前位置
SEEK_END:文件指针文件末尾的位置
SEEK_SET:文件指针指向文件开头的位置
代码:fseek(pf, 2, SEEK_SET);
接下来我们分析,原来test.txt文件中放入了“abcdef”。
SEEK_SET:表示从起始位置a开始。(源位置)
2:相对于源位置偏移量为2。
pf:文件指针
每次读取之后,文件指针会默认向后偏移1。
我们不难得出的结果应该是'c',运行结果如下:
再举个栗子:
#include<stdio.h>
#include<stdlib.h>
int main()
{
FILE* pf = fopen("test.txt", "rb");
if (pf == NULL)
{
printf("fopen fail\n");
exit(-1);
}
fseek(pf, -5, SEEK_END);
char ch = fgetc(pf);
printf("%c\n", ch);
fclose(pf);
pf = NULL;
return 0;
}
运行结果:
如果SEEK_END从文件末尾往前定位,最后一个字符的偏移量为-1 ,和SEEK_SET定位到开头时的情况还不一样,那时候开头的字符默认偏移量为0。
ftell
返回文件指针相对于起始位置的偏移量。
使用方法:
#include<stdio.h>
#include<stdlib.h>
int main()
{
FILE* pf = fopen("test.txt", "rb");
if (pf == NULL)
{
printf("fopen fail\n");
exit(-1);
}
fseek(pf, -3, SEEK_END);
char ch = fgetc(pf);
printf("%c\n", ch);
int ret = ftell(pf);
printf("%d\n", ret);
fclose(pf);
pf = NULL;
return 0;
}
long ftell( FILE *stream );
FILE *stream:文件指针。
分析代码:
首先, fseek(pf, -3, SEEK_END); 读取到字符d的位置然后打印字符d,此时偏移量为3。
每次读取字符d之后,文件指针会自动向后偏移一个位置,此时指到了字符e的位置,偏移量为4.
运行结果:
rewind
让文件指针的位置回到文件的起始位置
使用案例:
#include<stdio.h>
#include<stdlib.h>
int main()
{
FILE* pf = fopen("test.txt", "rb");
if (pf == NULL)
{
printf("fopen fail\n");
exit(-1);
}
fseek(pf, -3, SEEK_END);
rewind(pf);
char ch = fgetc(pf);
printf("%c\n", ch);
fclose(pf);
pf = NULL;
return 0;
}
rewind之后字符指针应该指向开头的位置,就是字符'a'。
运行结果:
文件结束判断
feof
牢记:在文件读取过程中,不能用feof函数的返回值直接用来判断文件的是否结束。
而是应用于当文件读取结束的时候,判断是读取失败结束,还是遇到文件尾结束
1. 文本文件读取是否结束,判断返回值是否为EOF (fgetc),或者NULL(fgets)
例如:
fgetc判断是否为EOF.
fgets判断返回值是否为NULL.
2. 二进制文件的读取结束判断,判断返回值是否小于实际要读的个数。
例如:
fread判断返回值是否小于实际要读的个数. //\n也算一个读取到的值
文本文件的例子
#include <stdio.h>
#include <stdlib.h>
int main(void)
{
int c=0; // 注意:int,非char,要求处理EOF
FILE* fp = fopen("test.txt", "r");
if (!fp) //如果fp为NULL,!p为真,就进入if语句中
{
perror("File opening failed");
return EXIT_FAILURE;
}
//fgetc 当读取失败的时候或者遇到文件结束的时候,都会返回EOF
while ((c = fgetc(fp)) != EOF) // 标准C I/O读取文件循环
{
putchar(c);
}
//判断是什么原因结束的
if (ferror(fp))
puts("\nI/O error when reading");
else if (feof(fp))
puts("\nEnd of file reached successfully");
fclose(fp);
fp = NULL;
}
二进制文件的例子
#include<stdio.h>
enum
{
SIZE = 5
};
int main()
{
double a[SIZE] = { 1.0,2.0,3.0,4.0,5.0 };
double b = 0.0;
size_t ret_code = 0;
FILE* fp = fopen("test.txt", "wb"); // 必须用二进制模式
fwrite(a, sizeof(*a), SIZE, fp); // 写 double 的数组
fclose(fp);
fp = fopen("test.txt", "rb");
// 读 double 的数组
while ((ret_code = fread(&b, sizeof(double), 1, fp)) >= 1)
{
printf("%lf\n", b);
}
if (feof(fp))
printf("Error reading test.txt: unexpected end of file\n");
else if (ferror(fp))
{
perror("Error reading test.txt");
}
fclose(fp);
fp = NULL;
}
运行结果: