目录
对于某些程序来说,相对应的数据需要长久的保存,但当程序运行结束后,内存会被收回,存放在内存中的数据也会被清除,要想一直保存这些数据,便可以使用文件。
一,文件及其分类
通俗来讲,磁盘(硬盘)上的文件就是文件。C语言中涉及的文件从功能方面可分为程序文件和数据文件两类。
1,程序文件
该文件就是我们日常编写代码会接触到的源文件(.c)、目标文件(windows中的.obj)、可执行程序文件(windows中的.exe)。
2,数据文件
该文件便是开头讲到的存放数据的文件(后面操作的对象便是它),它可以存放相关信息,方便运行程序时,直接从中读取到内存中使用。
下面开讲数据文件:
数据文件根据数据的存放(组织)方式,分成了二进制文件和文本文件。在文件中,字符一律以ASCII形式存储,数值型数据既可以用ASCII形式也可以用二进制形式存放。
(1)二进制文件
数据在内存中以二进制形式存在,如果直接存进文件中,此类文件被称为二进制文件,二进制文件倘若直接打开观看是看不懂的。
下面我在test.txt中以二进制形式存放了1~5五个数字,直接打开后显示的结果。
(2)文本文件
数据在内存中以二进制形式存在,当存进文件时,数据内容被转化为ASCII字符形式存放,该种文件被称为文本文件,此文件在打开状态下可以直接被阅读。
下面是在文件中以ASCII字符形式存放 a~z 26个字母后,直接打开的结果。
二,文件的操作(开闭读写)
在学习文件操作之前,我们得了解一些概念,以便更好地理解运用操作函数。
1,流
流是一种抽象的概念,我们程序的数据需要输出到各种外部设备,也需要从外部设备获取数据,不同的外部设备的输入输出 操作各不相同,为了方便程序员对各种设备进行方便的操作,我们抽象出了流的概念,我们可以把流想象成流淌着字符的河。
C程序针对文件、画面、键盘等的数据输入输出操作都是通过流操作的。 一般情况下,我们要想向流里写数据,或者从流中读取数据,都是要打开流,然后操作。
运行C语言程序时,系统会自动打开3个流(标准流),我们用键盘输入数据或向屏幕输出数据时,便开始使用流。如下:
标准流:
- stdin 标准输入流,大多数环境从键盘输入,如 sacnf 。
- stdbout 标准输出流,大多数环境输出到显示器,如 printf 。
- stderr 标准错误流,大多数环境输出到显示器。
它们的类型是FILE* 即下面我们要讲的文件指针。
2,文件指针
为了每次打开文件能够更好地对文件的内容进行操作,文件指针便出现了,每当我们打开一个文件,在内存中便会开辟一个对应的文件信息区,用以存放该文件的相关属性(位置,名称,状态等等),要想访问该信息区,便需要对文件指针进行操作。
文件指针的类型是 FILE*(file即文件),其指向特定文件(通俗来讲即此文件的别名)。总结:通过文件指针变量能够间接找到与它相关联的文件。
下面讲到文件指针的使用。
3,文件开闭函数
要访问文件,必须先打开文件,值得注意的是,在文件访问完之后要对文件进行关闭(倘若程序一直进行而文件使用完后未关闭,则会造成内存浪费)。
下面我们学习相关操作:
(1)打开文件(fopen)
在 cplusplus中,我们可以了解,fopen 函数返回一个 FILE* 的指针,该指针便是文件指针。
它有两个参数:
- const char * filename 文件的名字,使用时: “文件名” (英文双引号加文件名)。
- const char * mode 文件的打开方式,使用时: “打开方式” (下讲)
使用示例如下图:(pf 为接收文件地址的指针,text.txt 为文件名,r 为打开方式)
打开方式(mode):
- r 仅仅用于读取文件(输入),该文件必须存在,否则fopen 返回NULL(空指针)
- w 仅仅用以保存数据到文件中(输出),文件倘若不存在,则新建一个文件
- a 用以向文件数据末尾添加数据,文件倘若不存在,则新建一个文件
- rb 仅仅用以读取二进制文件数据(输入), 该文件必须存在,否则fopen 返回NULL(空指针)
- wb 仅仅用以二进制形式保存数据到文件中,文件倘若不存在,则新建一个文件
- ab 向一个二进制文件数据末尾添加数据(以二进制形式),文件倘若不存在,则新建一个文件
- 以上为常用方式
- r+ 为了读和写,打开⼀个文本文件
- w+ 为了读和写,建议⼀个新的文件
- a+ 打开⼀个⽂件,在⽂件尾进行读写
- rb+ 为了读和写打开⼀个⼆进制文件
- wb+ 为了读和写,新建⼀个新的二进制⽂件
- ab+ 打开⼀个二进制文件,在文件尾进行读和写
(2)关闭文件(fclose)
上面说到,文件打开使用完后就要关闭,否则可能造成内存浪费,这里我们学习文件的关闭。
可见,fclose 返回一个 int 数值,当文件被成功关闭时,返回零,否则返回EOF(即负一);fclose 的参数仅有一个,FILE* stream 即文件指针,即要关闭的文件地址。
值得注意的是,文件关闭之后,文件的内存被收回,此时文件指针则指向一个未知的地址,我们需要对其置空(空指针),操作如下:
4,文件读写函数
当我们都了解了上面的相关事项后,便可以开始文件的操作了。
文件读写方式分为
- 顺序读写(按顺序读写)
- 随机读写(想从哪儿读都可以)
下面我们一一讲解。
(1)顺序读写
在顺序读写中,依据读写形式又可以分为:
- 对字符(fgetc ,fputc)
- 对字符串(fgets,fputs)
- 对二进制文件(fread,fwrite)
- 对标准流(fprintf,fscanf)
fgetc(字符输入函数)
返回值:fgetc返回值为 int 类型,成功读取时,返回读取字符的ASCII码值;反之,如果遇见文件末尾后读取失败时返回 EOF。
参数: fgetc有一个参数,该参数是 fgetc 的操作对象(文件指针)。
值得注意的是:fgetc 每次读取仅能读取一个字符,每读取一次,光标便会向后移动一位(光标操作本篇后讲)。
fputc (字符输出函数)
返回值:同fgetc类似,返回值为 int 类型,成功写入文件时,返回成功写入字符的ASCII码值;反之,如果写入失败时返回 EOF。
参数:int character,指的是要写入的字符(可以是字符也可以是其ASCII码值);FILE* stream,文件指针,通过其对相应文件进行操作。(一次一个字符)
fgets(文本输入函数)
返回值:返回值为 char* 指针,拷贝成功时为拷贝对象的地址,失败则为空指针(NULL)。
参数:该函数操作对象为文件,拷贝对象为指针(一般为数组),char * str即指针;int num 为要拷贝的最大字符数,FILE*stream,即操作文件。
注意事项:对于拷贝到数组内,因为int num为最大读取字符数,fgets会自动流出一个位置给 \0(字符串结束标志),所以在估计 num 时要比实际读入字符大一位。
fputs(文本输出函数)
返回值:当成功输出时,返回一个非零值;否则返回EOF。
参数:const char* str,可以是字符串,也可以是数组(二者传入的均是首元素地址);FILE * stream,为要输入的对象文件。
注意事项:字符串数据都是单行输出,要想输出双行则需要主动输入换行符( \n )。
fprintf (格式化输出函数)
与 printf ,sprintf相比较可得
- printf 把数据以格式化形式输出在标准输出流(一般是屏幕)上;
- fprintf 把数据以格式化形式输出在指定的输出流(可以是文件,屏幕等等)上;
- sprintf 把格式化数据转化为字符串,并存放在字符串或数组内。
该函数除了第一个参数 printf 没有外,其余参数用法一样,fprintf 用于输入到文件中(以文本的形式)。fprintf 的第一个参数:FILE* stream 指的是数据输出的文件对象。
fscanf(格式化输入函数)
同样,与scanf ,sscanf 相比较:
- scanf 在标准输入流(一般是键盘)上获取格式化数据(%c,%d,%f等等),并赋值;
- fprintf 在指定的输入流(可以是文件,键盘等等)上以格式化形式获取数据,并赋值;
- sscanf 在字符串(或数组)中读取格式化的数据,并对变量进行赋值。
与 fprintf与printf 一样,二者也是仅相差第一个参数,该参数用于指明数据输入的来源(从文件中输入)。
以上适用于所有输入(输出)流。
fread(二进制输入)
总结:从stream文件中读取 count 个数的 size 大小的数据,存放到 ptr 中。
参数:void *ptr,size_t size,size_t count,FILE*stream。
返回值:返回成功读取的数据个数,当我们不知道文件内数据个数时,便可以用循环一个一个数据读取。
fwrite(二进制输出)
总结:从ptr 上读取 size 大小的 count 个数的数据,最后输出到 stream 文件中。
参数:const void*ptr 获取数据对象--数组,size_t size 获取的数据的大小,size_t count 获取的数据的数量,FILE* stream 数据输出的对象.
返回值:成功写入的数据个数。
以上两个函数仅适用于文件流。
注意:对于二进制的输入与输出,读取方式要改成 “wb” 或 “rb”。
注意:
- 以上都要注意光标的位置。
- 对于输入还是输出,以程序视角观察,数据进入程序则为输入。
(2)随机读写
以上方式都是按照先后顺序来进行读取的,要想在指定位置读取的话,我们需要用到以下函数(操作对象是光标,起始,光标默认在句首第一个元素上)。
fseek
参数:
FILE* stream 文件流,操作对象;
long int offset 偏移量,将光标向后偏移(移动距离)的大小(如:4,为向后偏移4位,-4,位向前偏移4位);
int origin (光标)起始位置,有以下三种情况: 用以初始化光标位置。
SEEK_SET | Beginning of file(文件的光标起始位置) |
SEEK_CUR | Current position of the file pointer(文件光标的当前位置) |
SEEK_END | End of file *(文件末尾) |
用法:利用光标的位置自由对文件数据进行操作
ftell
返回值:返回文件光标相对于起始位置的偏移量。
参数:参数是操作的对象:文件。
用法:,还可用以得出文件的数据长度。
rewind
用法:让文件中光标回到默认的起始位置 。
5,文件读取结束的判定
文件读取结束的可能原因:
- 读取发生错误
- 读取遇到文件末尾
我们每打开一个文件(流),都会自动产生两个标记状态:1,是否遇到文件末尾;2,是否读取错误。当其中的事件发生时,对应标记便会被记录。
我们可以凭借相关函数的返回值判断。
1,判断文件是否读取结束:
fgetc 判断返回值是否为 EOF;
fgets 判断返回值是否为 NULL;
2,当文件已经停止读取时,要想了解因为什么而停止读取,可以用以下函数。
feof
用以判断结束原因是否为遇到文件末尾。当文件读取结束原因是遇到文件末尾时,返回非零值,否则返回零。
ferror
用以判断解释原因是否为读取发生错误。当文件读取结束原因是读取时发生错误时,返回非零值,否则返回零。
上面两者是一起存在的,相辅相成,用法如下:
if (feof(pf))
{
printf("正常读取结束");
}
else if(ferror(pf))
{
printf("读取发生错误");
}
三,拓展知识:文件缓冲区
ANSIC 标准采用“缓冲文件系统” 处理的数据文件的,所谓缓冲文件系统是指系统自动地在内存中为 程序中每⼀个正在使用的文件开辟⼀块“文件缓冲区”。
从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才⼀起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓冲区(充满缓冲区,然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。
缓冲区的大小根据C编译系统决定的。
#include <stdio.h>
#include <windows.h>
//VS2019 WIN11环境测试
int main()
{
FILE*pf = fopen("test.txt", "w");
fputs("abcdef", pf);//先将代码放在输出缓冲区
printf("睡眠10秒-已经写数据了,打开test.txt⽂件,发现⽂件没有内容\n");
Sleep(10000);
printf("刷新缓冲区\n");
fflush(pf);//刷新缓冲区时,才将输出缓冲区的数据写到⽂件(磁盘)
//注:fflush 在⾼版本的VS上不能使⽤了
printf("再睡眠10秒-此时,再次打开test.txt⽂件,⽂件有内容了\n");
Sleep(10000);
fclose(pf);
//注:fclose在关闭⽂件的时候,也会刷新缓冲区
pf = NULL;
return 0;
}
因为有缓冲区的存在,C语言在操作文件的时候,需要做刷新缓冲区或者在文件操作结束的时候关闭文件。 如果不做,可能导致读写文件的问题。