C语言文件操作
一、什么是文件?
在我们使用的计算机的磁盘中的内容都是文件。在程序设计中,文件又可以分为两种类型:程序文件和数据文件(从文件的功能分类)。
- 程序文件:包含源程序文件(.c),目标文件(Windows环境下为.obj),和可执行程序文件(Windows环境下为.exe)
- 数据文件:数据文件就是程序运行时读写的数据,既可以读取,也可以输出为数据内容。
对于每一个文件来讲,都要有一个唯一的文件标识,方便用户识别和使用,而这个文件标识就叫做文件名。一个文件名包括三个部分:文件路径+文件名主干+文件名后缀
二、文件指针
缓冲文件系统中,关键的概念就是“文件类型指针”,简称文件指针。
在电脑中我们使用的每个文件都会在内存中开辟对应的文件信息区,用来存放文件的相关信息(文件名,文件状态以及文件当前位置)。这些信息就保存在一个结构体变量中。该结构类型是有系统声明的,取名为FILE。
文件指针的类型是指向FILE的指针,FILE是一个定义在stdio.h中的派生类型。文件指针fp并不指向实际的文件,它指向一个包含文件信息的数据对象,其中包含操作文件的I/O函数所用的缓冲区信息。
不同的C编译器的FILE 类型包含的内容不完全相同,但是基本大同小异。每当打开一个文件的时候,系统会根据文件的情况自动创建一个FILE类型的变量,并填充其中的信息。而我们一般是通过一个指针来维护这个FILE类型的变量。
请看下面代码:
#include <stdio.h>
int main ()
{
FILE * pFile;
//打开文件
pFile = fopen ("myfile.txt","w");
//文件操作
if (pFile!=NULL)
{
fputs ("fopen example",pFile);
//关闭文件
fclose (pFile);
}
return 0;
}
上面代码中,fopen的作用就是打开一个文件,第一个参数为文件名,如果是当前目录下,可以使用相对路径,否则要使用绝对路径。第二个参数是文件的打开方式,这里的w表示写。
下图就是fopen的打开方式:
fclose函数和fopen相对应,是关闭文件的函数。
三、文件读写函数
下面是一些文件读写的函数:
功能 | 函数名 | 适用于 |
---|---|---|
字符输入函数 | fgetc | 所有输入流 |
字符输出函数 | fputc | 所有输出流 |
文本行输入函数 | fgets | 所有输入流 |
文本行输出函数 | fputs | 所有输出流 |
格式化输入函数 | fscanf | 所有输入流 |
格式化输出函数 | fprintf | 所有输出流 |
二进制输入 | fread | 文件 |
二进制输出 | fwrite | 文件 |
通过一段代码,给大家介绍:
int main()
{
//打开文件
FILE* pf = fopen("test1.txt", "w"); //两个参数const char* 类型,记得用" "
if (pf == NULL)
{
printf("%s\n", strerror(errno));
return 0;
}
//使用文件
fputc('a', pf);
fputc('b', pf);
fputc('c', pf);
fputc('d', pf);
fputc('e', pf);
fputc('f', pf);
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
首先打开文件,在fopen函数中输入函数名和打开方式,"w"表示写,就是要向文件里写数据。这里要注意一点,如果以"w"的方式打开文件,若文件不存在,就会自己创建一个对应文件名的文件,如果文件存在,本次写入文件的内容就会覆盖掉原先文件的内容。
打开文件之后就可以向文件内写入数据了,fputc的作用就是向pf所指向的地方写入字符,每写完一个字符,会自动移到下一个位置,不用担心覆盖。操作完成以后也要记得通过函数fclose关闭文件。
通过上述操作,可以把数据写入到文件内了,那如果要从文件内读取该如何做呢?请看下面代码:
int main()
{
//打开文件
FILE* pf = fopen("test1.txt", "r");
if (pf == NULL)
{
printf("%s\n", strerror(errno));
return 0;
}
int ch = 0;
while ((ch = fgetc(pf)) != EOF)
{
printf("%c ", ch);
}
fclose(pf);
pf = NULL;
return 0;
}
在上述代码中,fgetc是和fputc成对出现的,一个是读,一个是写。所以,我们可以通过使用fgetc函数从文件里读取字符。当然,和fputc一样,fgetc没读取一个字符,就会指向下一个字符。
EOF是文件结束标志,当当文件结束时,fgetc就会返回EOF
既然文件指针会随着读写函数进行改变,那能不能让文件指针指向我们希望它指向的地方呢,当然可以,请看下面代码:
int main()
{
FILE* pf = fopen("data.txt", "r");
if (pf == NULL)
{
printf("%s\n", strerror(errno));
return -1;
}
int ch;
ch = fgetc(pf);
printf("%c ", ch);
ch = fgetc(pf);
printf("%c ", ch);
//两次读取过后,文件指针会指向第三个字符的位置
fseek(pf, -2, SEEK_CUR);
ch = fgetc(pf);
printf("%c ", ch);
return 0;
}
首先打开的文件中一共存了六个字符,读取两次过后,文件指针就会指向第三个字符,这时我们使用fseek函数,改变了文件指针的指向,第一个参数就是要操作的文件指针,第二个参数是我们希望的偏移量,负数表示向上一个偏移,第三个参数是我们要改变的位置,即从何处开始进行偏移,SEEK_CUR表示从当前指针指向的位置开始偏移,即从第三个位置开始偏移。
结果如下图所示:
试想一下,有没有这样一种情况,我们在程序中多次修改文件指针的指向,结果最后自己不知道文件指针指向了何处,如何迅速找到文件指针的指向呢?
请看下面代码:
int main()
{
FILE* pf = fopen("data.txt", "r");
if (pf == NULL)
{
printf("%s\n", strerror(errno));
return -1;
}
int ch;
ch = fgetc(pf);
printf("%c ", ch);
fseek(pf, 2, SEEK_CUR);
ch = fgetc(pf);
printf("%c \n", ch);
int pos;
pos = ftell(pf);
printf("%d \n", pos);
return 0;
}
ftell函数可以满足我们的要求,当你多次修改文件指针的指向,想要返回当前文件指针的偏移量时,可以使用ftell函数。结果如下:
同时,如果希望文件指针回到文件的起始位置,只需要使用rewind函数就可以实现。该函数只有一个参数,只需传入对应文件的文件指针即可。
四、文本文件和二进制文件
根据数据的组织形式,数据文件被称为文本文件或者二进制文件。数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是二进制文件。如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件。
一个数据在内存中是怎么存储的呢?
字符一律以ASCII形式存储,数值型数据既可以用ASCII形式存储,也可以使用二进制形式存储。如有整数10000,如果以ASCII码的形式输出到磁盘,则磁盘中占用5个字节(每个字符一个字节,即字符’1’,‘0’,‘0’,‘0’,‘0’),而二进制形式输出,则在磁盘上只占4个字节(即正数10000的二进制表示形式)。
五、文件缓冲区
ANSIC 标准采用“缓冲文件系统”处理的数据文件的,所谓缓冲文件系统是指系统自动地在内存中为程序中每一个正在使用的文件开辟一块“文件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓冲区的大小根据C编译系统决定的。
我们通过一幅图来理解:
就好像cpu,cache和内存的关系一样。