文件操作（C语言）

根据数据的组织形式，数据文件被称为文本文件或者二进制文件。
数据在内存中以二进制的形式存储，如果不加转换的输出到外存，就是二进制文件。
如果要求在外存上以ASCII码的形式存储，则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件。
一个数据在内存中是怎么存储的呢？
字符一律以ASCII形式存储，数值型数据既可以用ASCII形式存储，也可以使用二进制形式存储。
如有整数10000，如果以ASCII码的形式输出到磁盘，则磁盘中占用5个字节（每个字符一个字节），而二进制形式输出，则在磁盘上只占4个字节

简单点来说，二进制文件就是以二进制的形式储存的文件；文本文件就是按照字符的形式（存的是ASCII码）储存的文件。而且，文本文件我们是可以直接看懂，而二进制文件需要借助工具转化一下数据才能看懂。

4. 文件的打开和关闭

4.1 文件指针

缓冲文件系统中，关键的概念是“文件类型指针”，简称“文件指针”
每个被使用的文件都在内存中开辟了一个相应的文件信息区，用来存放文件的相关信息（如文件的名字，文件状态及文件当前的位置等）。这些信息是保存在一个结构体变量中的。该结构体类型是由系统声明的，取名FILE
例如，VS2013编译环境提供的stdio.h头文件有以下文件类型声明：

struct _iobuf {
char *_ptr;
int _cnt;
char *_base;
int _flag;
int _file;
int _charbuf;
int _bufsiz;
char *_tmpfname;
};
typedef struct _iobuf FILE;

不同的C编译器的FILE类型包含的内容不完全相同，但是大同小异。

每当打开一个文件的时候，系统会根据文件的情况自动创建一个FILE结构的变量，并填充其中的信息，使用者不必关心细节。

一般都是通过一个FILE的指针来维护这个FILE结构的变量，这样使用起来更加方便。

下面，我们创建一个文件指针变量：

FILE* pf;//文件指针变量

定义pf是一个指向FILE类型数据的指针变量。可以使pf指向某个文件的文件信息区（是一个结构体变量）。通过该文件信息区中的信息就能够访问该文件。也就是说，通过文件指针变量能够找到与它关联的文件

比如：

4.2 文件的打开和关闭

文件在使用时，要先打开，再使用，最后关闭

打开和关闭文件，分别使用的是 fopen 和 fclose 函数

//打开文件
FILE * fopen ( const char * filename, const char * mode );
                    //要打开的文件名        文件的打开模式

//关闭文件
int fclose ( FILE * stream );

mode 表示文件的打开模式：

r是只读，w是只写，a是追加，rb是只读，wb是只写，ab是追加，剩下的都是读写。

该怎么记忆呢？r是读，w是写，add是追加，b是二进制，+是读写，文件必须存在的是r，其他文件都可以不存在。

示例：

int main()
{
	//打开文件
	FILE* pf = fopen("test.txt", "w");
	if (pf == NULL)
	{
		perror("fopen");
		return 1;
	}

	//关闭文件
	fclose(pf);
	pf = NULL;

	return 0;
}

5. 文件的顺序读写

5.1 顺序读写函数

函数名	功能	适用于
fgetc	字符输入函数	所有输入流
fputc	字符输出函数	所有输出流
fgets	文本行输入函数	所有输入流
fpust	文本行输出函数	所有输出流
fscanf	格式化输入函数	所有输入流
fprintf	格式化输出函数	所有输出流
fread	二进制输入	文件
fwrite	二进制输出	文件

5.1.1 fputc

int fputc ( int character, FILE * stream );

示例：

5.1.2 fgetc

int fgetc ( FILE * stream );

函数的两种情况：

如果成功读取到字符的话，返回的是字符的ASCII码值
如果遇到读取文件末尾，或者读取失败的时候，返回的是EOF（-1）

为了兼容两种情况，所以返回值是int，而不是char。

示例：

int main()
{
	//打开文件
	FILE* pf = fopen("test.txt", "r");
	if (pf == NULL)
	{
		perror("fopen");
		return 1;
	}

	//读文件
	int ch = fgetc(pf);
	printf("%c\n", ch);

	//关闭文件
	fclose(pf);
	pf = NULL;

	return 0;
}

5.1.3 fputs

int fputs ( const char * str, FILE * stream );

用法和fputc大致相同

示例：

int main()
{
	//打开文件
	FILE* pf = fopen("test.txt", "w");
	if (pf == NULL)
	{
		perror("fopen");
		return 1;
	}
	//写入文件
	fputs("hello world", pf);
	fputs("你好世界", pf);

	//关闭文件
	fclose(pf);
	pf = NULL;

	return 0;
}

5.1.4 fgets

char * fgets ( char * str, int num, FILE * stream );

该函数中的num是指最多读取num个字符，但是实际操作时我们会发现顶多只能读num - 1个字符，这是因为字符串是以'\0'来结束的，所以要预留一个位置给'\0'。

示例：

int main()
{
	//打开文件
	FILE* pf = fopen("test.txt", "r");
	if (pf == NULL)
	{
		perror("fopen");
		return 1;
	}

	//读文件
	char arr[10] = { 0 };
	fgets(arr, 10, pf);

	//关闭文件
	fclose(pf);
	pf = NULL;

	return 0;
}

看看调试的结果：

若是num远大于可读取的字符数，那么结果会如何呢？

这里我们把字符数组arr的大小改成20，num也改成20，再来看看结果

此时我们发现，如果情况允许，那么fgets会把字符串后面的'\n'也读取进字符串，然后再加上'\0'。

5.1.5 fprintf

int fprintf ( FILE * stream, const char * format, ... );

int printf ( const char * format, ... );

可以看到，fprintf与printf极其相似，参数上只多了一个文件指针

示例：

struct S
{
	char name[20];
	int age;
	float score;
};

int main()
{
	struct S s = { "zhangsan", 20,65.5f };
	//打开文件
	FILE* pf = fopen("test.txt", "w");
	if (pf == NULL)
	{
		perror("fopen");
		return 1;
	}

	//写文件
	fprintf(pf, "%s %d %f", s.name, s.age, s.score);


	//关闭文件
	fclose(pf);
	pf = NULL;

	return 0;
}

结果：

结果说明sprintf是以文本的形式写入文件

5.1.6 fscanf

int fscanf ( FILE * stream, const char * format, ... );

int scanf ( const char * format, ... );

示例：

struct S
{
	char name[20];
	int age;
	float score;
};

int main()
{
	struct S s = { 0 };
	//打开文件
	FILE* pf = fopen("test.txt", "r");
	if (pf == NULL)
	{
		perror("fopen");
		return 1;
	}

	//读文件
	fscanf(pf, "%s %d %f", s.name, &(s.age), &(s.score));
	printf("%s %d %f", s.name, s.age, s.score);

	//关闭文件
	fclose(pf);
	pf = NULL;

	return 0;
}

结果：

5.1.7 fwrite

size_t fwrite ( const void * ptr, size_t size, size_t count, FILE * stream );

该函数是将数组写入文件，ptr是数组地址，size 是要写入的每个元素的大小，count是要写入元素的数量，stream是文件的指针

int main()
{
	int arr[] = { 1,2,3,4,5 };

	//打开文件
	FILE* pf = fopen("test.txt", "wb");
	if (pf == NULL)
	{
		perror("fopen");
		return 1;
	}

	//写文件
	int sz = sizeof(arr) / sizeof(arr[0]);
	fwrite(arr, sizeof(arr[0]), sz, pf);

	//关闭文件
	fclose(pf);
	pf = NULL;

	return 0;
}

文件为二进制文件。

5.1.8 fread

size_t fread ( void * ptr, size_t size, size_t count, FILE * stream );

返回值为成功读取的元素个数

示例：

int main()
{
	int arr[5] = { 0 };

	//打开文件
	FILE* pf = fopen("test.txt", "rb");
	if (pf == NULL)
	{
		perror("fopen");
		return 1;
	}

	//写文件
	fread(arr, sizeof(arr[0]), 5, pf);
	int i = 0;
	for (i = 0; i < 5; i++)
	{
		printf("%d ", arr[i]);
	}

	//关闭文件
	fclose(pf);
	pf = NULL;

	return 0;
}

结果：

6. 文件的随机读写

6.1 fseek

int fseek ( FILE * stream, long int offset, int origin );

三个变量分别是流偏移量起始位置

起始位置有三种选择

SEEK_SET 文件的起始位置
SEEK_CUR 当前所指向的位置
SEEK_END 文件的末尾（因为是文件末尾，数据在左边，所以使用该位置时偏移量为负的）

示例：

int main()
{
	FILE* pf = fopen("test.txt", "r");
	if (pf == NULL)
	{
		perror("fopen");
		return 1;
	}

	//读文件
	int ch = fgetc(pf);
	printf("%c\n", ch);//a

	fseek(pf, 6, SEEK_CUR);
	//fseek(pf, 7, SEEK_SET);
	//fseek(pf, -3, SEEK_END);

	ch = fgetc(pf);
	printf("%c\n", ch);//

	fclose(pf);
	pf = NULL;

	return 0;
}

test.txt的内容如下：

此时的结果：

当然，分别使用注释的那两行代码结果也都是相同的。

6.2 ftell

返回文件指针当前位置相对于起始位置的偏移量

long int ftell ( FILE * stream );

返回值：

成功后，返回位置指标的当前值。
失败时，返回 -1L，并将 errno 设置为特定于系统的正值。

因为该函数成功运行之后能返回位置指标的当前值，所以可以将文件指针移向文件末尾，再利用ftell的返回值求文件长度

6.3 rewind

让文件指针的位置回到文件的起始位置

void rewind ( FILE * stream );

7. 文件读取结束的判定

7.1 feof

int feof ( FILE * stream )

在文件读取过程中，不能用feof函数的返回值直接来判断文件的是否结束。
feof的作用是：当文件读取结束的时候，判断读取结束的原因是否是“遇到文件尾结束”

文件读取结束的原因有两个：

遇上了文件末尾
读取的时候发生了错误

feof只能判断第一个原因

7.2 正确判断文件读取结束的方法

1. 文本文件判断返回值是否是EOF或者NULL

fgetc 判断返回值是否是EOF
fgets 判断返回值是否是NULL

2. 二进制文件判断返回值是否小于实际要读的个数

fread 判断返回值是否小于实际要读的个数

8. 文件缓冲区

缓冲文件系统是指系统自动地在一内存中为程序中每一个正在使用的文件开辟一块“文件缓冲区”。从内存向磁盘输出数据时，是先将文件缓冲区装满，再一起向送到磁盘上；从磁盘向内存读入数据时，先是将文件缓冲区读满，再将数据送到程序数据区。

原因是因为操作系统将数据输入到磁盘的速率很慢，此时采用文件缓冲区的方式去储存较多数据能减少操作系统向磁盘输入的次数，以此增大效率。

#include <stdio.h>
#include <windows.h>
//VS2022 WIN11环境测试
int main()
{
 FILE*pf = fopen("test.txt", "w");
 fputs("abcdef", pf);//先将代码放在输出缓冲区

 printf("睡眠10秒-已经写数据了，打开test.txt文件，发现文件没有内容\n");
 Sleep(10000);
 printf("刷新缓冲区\n");
 fflush(pf);//刷新缓冲区时，才将输出缓冲区的数据写到文件（磁盘）
 //注：fflush 在高版本的VS上不能使用了

 printf("再睡眠10秒-此时，再次打开test.txt文件，文件有内容了\n");
 Sleep(10000);
 fclose(pf);
 //注：fclose在关闭文件的时候，也会刷新缓冲区
 pf = NULL;
 return 0; 
}

因为有缓冲区的存在，C语言在操作文件的时候，需要做刷新缓冲区或者在文件操作结束的时候关闭文件。如果不做，可能导致读写文件的问题。