C语言的文件与操作

苏格拉没有底111

已于 2024-08-07 10:29:59 修改

阅读量1k

点赞数 25

分类专栏： C语言文章标签： c语言开发语言学习

于 2024-05-09 17:37:38 首次发布

本文链接：https://blog.youkuaiyun.com/2301_80001281/article/details/138504264

版权

C语言专栏收录该内容

9 篇文章

订阅专栏

对于某些程序来说，相对应的数据需要长久的保存，但当程序运行结束后，内存会被收回，存放在内存中的数据也会被清除，要想一直保存这些数据，便可以使用文件。

一，文件及其分类

通俗来讲，磁盘（硬盘）上的文件就是文件。C语言中涉及的文件从功能方面可分为程序文件和数据文件两类。

1，程序文件

该文件就是我们日常编写代码会接触到的源文件（.c）、目标文件（windows中的.obj）、可执行程序文件（windows中的.exe）。

2，数据文件

该文件便是开头讲到的存放数据的文件（后面操作的对象便是它），它可以存放相关信息，方便运行程序时，直接从中读取到内存中使用。

下面开讲数据文件：

数据文件根据数据的存放（组织）方式，分成了二进制文件和文本文件。在文件中，字符一律以ASCII形式存储，数值型数据既可以用ASCII形式也可以用二进制形式存放。

（1）二进制文件

数据在内存中以二进制形式存在，如果直接存进文件中，此类文件被称为二进制文件，二进制文件倘若直接打开观看是看不懂的。

下面我在test.txt中以二进制形式存放了1~5五个数字，直接打开后显示的结果。

（2）文本文件

数据在内存中以二进制形式存在，当存进文件时，数据内容被转化为ASCII字符形式存放，该种文件被称为文本文件，此文件在打开状态下可以直接被阅读。

下面是在文件中以ASCII字符形式存放 a~z 26个字母后，直接打开的结果。

二，文件的操作（开闭读写）

在学习文件操作之前，我们得了解一些概念，以便更好地理解运用操作函数。

1，流

流是一种抽象的概念，我们程序的数据需要输出到各种外部设备，也需要从外部设备获取数据，不同的外部设备的输入输出操作各不相同，为了方便程序员对各种设备进行方便的操作，我们抽象出了流的概念，我们可以把流想象成流淌着字符的河。

C程序针对文件、画面、键盘等的数据输入输出操作都是通过流操作的。一般情况下，我们要想向流里写数据，或者从流中读取数据，都是要打开流，然后操作。

运行C语言程序时，系统会自动打开3个流（标准流），我们用键盘输入数据或向屏幕输出数据时，便开始使用流。如下：

标准流：

stdin 标准输入流，大多数环境从键盘输入，如 sacnf 。
stdbout 标准输出流，大多数环境输出到显示器，如 printf 。
stderr 标准错误流，大多数环境输出到显示器。

它们的类型是FILE* 即下面我们要讲的文件指针。

2，文件指针

为了每次打开文件能够更好地对文件的内容进行操作，文件指针便出现了，每当我们打开一个文件，在内存中便会开辟一个对应的文件信息区，用以存放该文件的相关属性（位置，名称，状态等等），要想访问该信息区，便需要对文件指针进行操作。

文件指针的类型是 FILE*（file即文件），其指向特定文件（通俗来讲即此文件的别名）。总结：通过文件指针变量能够间接找到与它相关联的文件。

下面讲到文件指针的使用。

3，文件开闭函数

要访问文件，必须先打开文件，值得注意的是，在文件访问完之后要对文件进行关闭（倘若程序一直进行而文件使用完后未关闭，则会造成内存浪费）。

下面我们学习相关操作：

（1）打开文件（fopen）

在 cplusplus中，我们可以了解，fopen 函数返回一个 FILE* 的指针，该指针便是文件指针。

它有两个参数：

const char * filename 文件的名字，使用时： “文件名” （英文双引号加文件名）。
const char * mode 文件的打开方式，使用时： “打开方式” （下讲）

使用示例如下图：（pf 为接收文件地址的指针，text.txt 为文件名，r 为打开方式）

打开方式（mode）：

r 仅仅用于读取文件（输入），该文件必须存在，否则fopen 返回NULL（空指针）
w 仅仅用以保存数据到文件中（输出），文件倘若不存在，则新建一个文件
a 用以向文件数据末尾添加数据，文件倘若不存在，则新建一个文件
rb 仅仅用以读取二进制文件数据（输入），该文件必须存在，否则fopen 返回NULL（空指针）
wb 仅仅用以二进制形式保存数据到文件中，文件倘若不存在，则新建一个文件
ab 向一个二进制文件数据末尾添加数据（以二进制形式），文件倘若不存在，则新建一个文件
以上为常用方式
r+ 为了读和写，打开⼀个文本文件
w+ 为了读和写，建议⼀个新的文件
a+ 打开⼀个⽂件，在⽂件尾进行读写
rb+ 为了读和写打开⼀个⼆进制文件
wb+ 为了读和写，新建⼀个新的二进制⽂件
ab+ 打开⼀个二进制文件，在文件尾进行读和写

（2）关闭文件（fclose）

上面说到，文件打开使用完后就要关闭，否则可能造成内存浪费，这里我们学习文件的关闭。

可见，fclose 返回一个 int 数值，当文件被成功关闭时，返回零，否则返回EOF（即负一）；fclose 的参数仅有一个，FILE* stream 即文件指针，即要关闭的文件地址。

值得注意的是，文件关闭之后，文件的内存被收回，此时文件指针则指向一个未知的地址，我们需要对其置空（空指针），操作如下：

4，文件读写函数

当我们都了解了上面的相关事项后，便可以开始文件的操作了。

文件读写方式分为

顺序读写（按顺序读写）
随机读写（想从哪儿读都可以）

下面我们一一讲解。

（1）顺序读写

在顺序读写中，依据读写形式又可以分为：

对字符（fgetc ，fputc）
对字符串（fgets，fputs）
对二进制文件（fread，fwrite）
对标准流（fprintf，fscanf）

fgetc（字符输入函数）

返回值：fgetc返回值为 int 类型，成功读取时，返回读取字符的ASCII码值；反之，如果遇见文件末尾后读取失败时返回 EOF。

参数： fgetc有一个参数，该参数是 fgetc 的操作对象（文件指针）。

值得注意的是：fgetc 每次读取仅能读取一个字符，每读取一次，光标便会向后移动一位（光标操作本篇后讲）。

fputc （字符输出函数）

返回值：同fgetc类似，返回值为 int 类型，成功写入文件时，返回成功写入字符的ASCII码值；反之，如果写入失败时返回 EOF。

参数：int character，指的是要写入的字符（可以是字符也可以是其ASCII码值）；FILE* stream，文件指针，通过其对相应文件进行操作。（一次一个字符）

fgets（文本输入函数）

返回值：返回值为 char* 指针，拷贝成功时为拷贝对象的地址，失败则为空指针（NULL）。

参数：该函数操作对象为文件，拷贝对象为指针（一般为数组），char * str即指针；int num 为要拷贝的最大字符数，FILE*stream，即操作文件。

注意事项：对于拷贝到数组内，因为int num为最大读取字符数，fgets会自动流出一个位置给 \0（字符串结束标志），所以在估计 num 时要比实际读入字符大一位。

fputs（文本输出函数）

返回值：当成功输出时，返回一个非零值；否则返回EOF。

参数：const char* str，可以是字符串，也可以是数组（二者传入的均是首元素地址）；FILE * stream,为要输入的对象文件。

注意事项：字符串数据都是单行输出，要想输出双行则需要主动输入换行符（ \n ）。

fprintf (格式化输出函数）

与 printf ，sprintf相比较可得

printf 把数据以格式化形式输出在标准输出流（一般是屏幕）上；
fprintf 把数据以格式化形式输出在指定的输出流（可以是文件，屏幕等等）上；
sprintf 把格式化数据转化为字符串，并存放在字符串或数组内。

该函数除了第一个参数 printf 没有外，其余参数用法一样，fprintf 用于输入到文件中（以文本的形式）。fprintf 的第一个参数：FILE* stream 指的是数据输出的文件对象。

fscanf（格式化输入函数）

同样，与scanf ，sscanf 相比较：

scanf 在标准输入流（一般是键盘）上获取格式化数据（%c，%d，%f等等），并赋值；
fprintf 在指定的输入流（可以是文件，键盘等等）上以格式化形式获取数据，并赋值；
sscanf 在字符串（或数组）中读取格式化的数据，并对变量进行赋值。

与 fprintf与printf 一样，二者也是仅相差第一个参数，该参数用于指明数据输入的来源（从文件中输入）。

以上适用于所有输入（输出）流。

fread（二进制输入）

总结：从stream文件中读取 count 个数的 size 大小的数据，存放到 ptr 中。

参数：void *ptr,size_t size,size_t count,FILE*stream。

返回值：返回成功读取的数据个数，当我们不知道文件内数据个数时，便可以用循环一个一个数据读取。

fwrite（二进制输出）

总结：从ptr 上读取 size 大小的 count 个数的数据，最后输出到 stream 文件中。

参数：const void*ptr 获取数据对象--数组,size_t size 获取的数据的大小,size_t count 获取的数据的数量,FILE* stream 数据输出的对象.

返回值：成功写入的数据个数。

以上两个函数仅适用于文件流。

注意：对于二进制的输入与输出，读取方式要改成 “wb” 或 “rb”。

注意：

以上都要注意光标的位置。
对于输入还是输出，以程序视角观察，数据进入程序则为输入。

（2）随机读写

以上方式都是按照先后顺序来进行读取的，要想在指定位置读取的话，我们需要用到以下函数（操作对象是光标，起始，光标默认在句首第一个元素上）。

fseek

参数：

FILE* stream 文件流，操作对象；

long int offset 偏移量，将光标向后偏移（移动距离）的大小（如：4，为向后偏移4位，-4，位向前偏移4位）；

int origin （光标）起始位置，有以下三种情况：用以初始化光标位置。

SEEK_SET	Beginning of file（文件的光标起始位置）
SEEK_CUR	Current position of the file pointer（文件光标的当前位置）
SEEK_END	End of file *（文件末尾）

用法：利用光标的位置自由对文件数据进行操作

ftell

返回值：返回文件光标相对于起始位置的偏移量。

参数：参数是操作的对象：文件。

用法：，还可用以得出文件的数据长度。

rewind

用法：让文件中光标回到默认的起始位置。

5，文件读取结束的判定

文件读取结束的可能原因：

读取发生错误
读取遇到文件末尾

我们每打开一个文件（流），都会自动产生两个标记状态：1，是否遇到文件末尾；2，是否读取错误。当其中的事件发生时，对应标记便会被记录。

我们可以凭借相关函数的返回值判断。

1，判断文件是否读取结束：

fgetc 判断返回值是否为 EOF；

fgets 判断返回值是否为 NULL；

2，当文件已经停止读取时，要想了解因为什么而停止读取，可以用以下函数。

feof

用以判断结束原因是否为遇到文件末尾。当文件读取结束原因是遇到文件末尾时，返回非零值，否则返回零。

ferror

用以判断解释原因是否为读取发生错误。当文件读取结束原因是读取时发生错误时，返回非零值，否则返回零。

上面两者是一起存在的，相辅相成，用法如下：

if (feof(pf))
{
	printf("正常读取结束");
}
else if(ferror(pf))
{
	printf("读取发生错误");
}

三，拓展知识：文件缓冲区

ANSIC 标准采用“缓冲文件系统” 处理的数据文件的，所谓缓冲文件系统是指系统自动地在内存中为程序中每⼀个正在使用的文件开辟⼀块“文件缓冲区”。

从内存向磁盘输出数据会先送到内存中的缓冲区，装满缓冲区后才⼀起送到磁盘上。如果从磁盘向计算机读入数据，则从磁盘文件中读取数据输入到内存缓冲区（充满缓冲区，然后再从缓冲区逐个地将数据送到程序数据区（程序变量等）。

缓冲区的大小根据C编译系统决定的。

#include <stdio.h>
#include <windows.h>
//VS2019 WIN11环境测试
int main()
{
 FILE*pf = fopen("test.txt", "w");
 fputs("abcdef", pf);//先将代码放在输出缓冲区
 printf("睡眠10秒-已经写数据了，打开test.txt⽂件，发现⽂件没有内容\n");
 Sleep(10000);
 printf("刷新缓冲区\n");
 fflush(pf);//刷新缓冲区时，才将输出缓冲区的数据写到⽂件（磁盘）
 //注：fflush 在⾼版本的VS上不能使⽤了
 printf("再睡眠10秒-此时，再次打开test.txt⽂件，⽂件有内容了\n");
 Sleep(10000);
 fclose(pf);
 //注：fclose在关闭⽂件的时候，也会刷新缓冲区
 pf = NULL;
 return 0;
}

因为有缓冲区的存在，C语言在操作文件的时候，需要做刷新缓冲区或者在文件操作结束的时候关闭文件。如果不做，可能导致读写文件的问题。