文章目录
文件:
一:为什么要使用文件
在日常中,我们写的程序的数据是存储在电脑的内存中的,那么当程序退出后,内存被回收,这时数据就会遗失,当我们下次运行程序的时候,是看不到上次的数据的。
那么有没有什么方法可以将数据进行持久化的保存?它就是文件
二:文件是什么
磁盘(硬盘)上的文件是文件
在程序设计中,我们将文件从功能的角度分为:程序文件,数据文件
1.程序文件
程序文件包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows环境后缀为.exe)。
2.数据文件
文件的内容不一定是一段程序,也可能是程序运行时读写的一些数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件。
3.文件名
一个文件要有一个唯一的文件标识——文件名,以便用户识别和引用。
文件名包含3部分:文件路径 \ 文件名主干 + 文件后缀
例如:C : \ code \ test . txt
三:文本文件和二进制文件
根据数据的组织形式,数据文件又可以再分为文本文件或者二进制文件
数据在内存中以二进制的形式存储,如果不加转换的输出到外存的文件中,就是二进制文件。
如果要求在外存上以ASCLL码的形式存储,在需要在存储前转换。以ASCLL字符的形式存储的文件就是文本文件
数据在文件中的存储:
字符一律以ASCLL形式存储,数值型数据即可用ASCLL形式存储,也可以用二进制形式存储。
例如:
整数10000,以ASCLL形式输出到磁盘,在磁盘中占用5个字节(一个字符占一个字节),而二进制形式输出,则在磁盘上只占4个字节。
测试代码:
#include <stdio.h>
int main()
{
int a = 10000;
FILE* pf = fopen("test.txt", "wb");
fwrite(&a, 4, 1, pf);//⼆进制的形式写到⽂件中
fclose(pf);
pf = NULL;
return 0;
}
四:文件的打开和关闭
1.流和标准流
(1)流:
我们程序的数据需要输出到各种外部设备,也需要从外部设备获取数据,不同的外部设备的输入输出操作各不相同,若需要程序员全部掌握,那么未免要求过高,因此为了方便程序员对各种设备进行方便的操作,我们抽象出流的概念
C程序针对文件、画面、键盘等数据的输入输出操作都是通过流进行的。
在一般情况下,我们想要向流里面写数据,或者从流中读取数据,首先要打开流,然后再操作。
(2)标准流:
那么我们在编写C程序时,并没有打开流,却能从键盘输入数据,向屏幕上打印输出数据呢?
因为C语言程序在启动的时候,默认打开3个流:
Ⅰ. stdin - 标准输入流,在大多数的环境中从键盘输入,scanf函数就是从标准输入流中读取数据。
Ⅱ. stdout - 标准输出流,大多数的环境中输出至显示器界面,printf函数就是将信息输出到标准输出流中。
Ⅲ. stderr - 标准错误流,大多数环境中输出到显示器界面。
这三个默认打开的流,使得我们使用scanf、printf等函数可以直接进行输入输出操作。
stdin、stdout、 stderr 三个流的类型是: FILE*,一般称为文件指针
在C语言中,我们通过FILE* 的文件指针来维护流的各种操作。
2.文件指针
缓冲文件系统中,关键概念为 “文件类型指针” ,简称 “文件指针” 。
每一个被使用的文件都会在内存中开辟一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。这些信息保存在一个结构体变量中。该结构体类型是由系统声明的,取名为FILE。
例如:
struct _iobuf {
char* _ptr;
int _cnt;
char* _base;
int _flag;
int _file;
int _charbuf;
int _bufsiz;
char* _tmpfname;
};
typedef struct _iobuf FILE;
不同的C编译器的FILE类型包含的内容不完全相同,但却大同小异。
每当打开文件时,系统会根据文件的情况自动创建一个FILE结构的变量,并填充其中的信息,使用者不必关心细节。
⼀般都是通过⼀个FILE的指针来维护这个FILE结构的变量,这样使用起来更加方便。
下面我们创建一个 FILE* 的指针变量:
FIlE* pf;//文件指针变量
pf是指向FILE类型的指针变量。可以让pf指向某个文件的文件信息区(是一个结构体变量)。通过该文件信息区中的信息就能够访问该文件。因此,通过文件指针变量能够间接找到与它关联的文件。
如下图:
3.文件的打开、关闭
⽂件在读写之前应该先打开文件,在使用结束之后应该关闭文件。
在编写程序的时候,打开文件时会返回一个 FILE* 的指针变量指向该文件,借此建立了指针与文件的关系。
ANSI C 规定使用 fopen 函数来打开文件, fclose 来关闭文件。
演示代码:
#include <stdio.h>
int main()
{
FILE* pFile;
//打开⽂件
pFile = fopen("myfile.txt", "w");
//⽂件操作
if (pFile != NULL)
{
fputs("fopen example", pFile);
//关闭⽂件
fclose(pFile);
}
return 0;
}
五:文件的顺序读写
1.顺序读写函数
上表说的适用于所有输入流一般指适用于标准输入流和其他输入流(如文件输入流);所有输出流一般指适用于标准输出流和其他输出流(如文件输出流)。
例如:
代码Ⅰ:
int main()
{
fputc('a', stdout);
return 0;
}
代码Ⅱ:
int main()
{
fprintf(stdout, "%s %d %.2lf", "张三", 20, 100.0);
return 0;
}
2.函数的对比
(1) scanf / fscanf / sscanf
Ⅰ:scanf - 从标准输入流上读取格式化的数据
Ⅱ:fscanf - 从指定的输入流上读取格式化的数据
Ⅲ:sscanf - 在字符串中读取格式化的数据
struct S
{
char name[10];
int age;
};
int main()
{
char str[200] = { 0 };
struct S s = { "张三", 20 };
sprintf(str, "%s %d", s.name, s.age); //以字符串的形式写道str中
printf("1.以字符串形式打印:");
printf("%s\n", str);
struct S s0 = { 0 };
sscanf(str, "%s %d", &s0.name, &s0.age); //在字符串中,以格式化形式读取
printf("2.以格式化形式打印:");
printf("%s %d\n", s0.name, s0.age);
return 0;
}
(2)printf / fprintf / sprintf
Ⅰ:printf - 把数据以格式化的形式打印在标准输出流上
Ⅱ:fprintf - 把数据以格式化的形式打印在指定的输出流上
Ⅲ:sprintf - 把格式化的数据转换为字符串
struct S
{
char name[10];
int age;
};
int main()
{
char str[200] = { 0 };
struct S s = { "张三", 20 };
sprintf(str, "%s %d", s.name, s.age); //以字符串的形式写道str中
printf("%s", str);
return 0;
}
六:文件的随机读写
1.fseek
根据文件指针的位置和偏移量来定位文件指针(文件内容的光标)。
例如:
int main()
{
FILE* pf = fopen("text.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
//读文件
int ch = fgetc(pf);
printf("%c\n", ch);
fseek(pf, 9, SEEK_SET);
ch = fgetc(pf);
printf("%c\n", ch);
fclose(pf);
pf = NULL;
return 0;
}
2.ftell
返回文件指针相对于起始位置的偏移量。。
int main()
{
FILE* pf = fopen("text.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
//读文件
fseek(pf, 9, SEEK_SET);
long n = ftell(pf);
printf("文件指针相对于起始位置的偏移量:%ld\n", n);
fclose(pf);
pf = NULL;
return 0;
}
3.rewind
让文件指针的位置回到文件的起始位置。
int main()
{
FILE* pf = fopen("text.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
fseek(pf, 9, SEEK_SET);
long n = ftell(pf);
printf("文件指针相对于起始位置的偏移量:%ld\n", n);
rewind(pf);
n = ftell(pf);
printf("让文件指针的位置回到文件的起始位置后,文件指针相对于起始位置的偏移量:%ld\n", n);
fclose(pf);
pf = NULL;
return 0;
}
七:文件读取结束的判定
feof:
在文件读取过程中,不能用feof函数的返回值直接来判断文件的是否结束。
feof 的作用是:当文件读取结束的时候,判断是读取结束的原因是否是:遇到文件尾而结束。
在打开的一个流的时候,这个流上有2个标记值:
(1) 是否遇到文件末尾 feof检测
(2) 是否发生错误 ferror检测
1 . 文本文件读取是否结束,判断返回值是否为 EOF ( fgetc ),或者 NULL( fgets )
例如:
• fgetc 判断是否为 EOF .
• fgets 判断返回值是否为 NULL .
2 . ⼆进制文件的读取结束判断,判断返回值是否小于实际要读的个数。
例如:
• fread判断返回值是否小于实际要读的个数。
代码:
int main()
{
FILE* pf = fopen("text.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
//写
char ch = 0;
for (ch = 'a'; ch <= 'z'; ch++)
{
fputc(ch, pf);
}
//判断是什么原因导致读取结束
if (feof(pf))
{
printf("遇到文件末尾,读取正常结束\n");
}
else if (ferror(pf))
{
perror("fputc");
}
return 0;
}
八:文件缓冲区
ANSIC 标准采用 “缓冲文件系统” 处理的数据文件的,缓冲文件系统是指系统自动地在内存中为程序中每⼀个正在使⽤的文件开辟⼀块 “文件缓冲区” 。从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才⼀起送到磁盘上。如果从磁盘向计算机读⼊数据,则从磁盘文件中读取数据输⼊到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓冲区的大小根据C编译系统决定的。
#include <stdio.h>
#include <windows.h>
//VS2022 WIN11环境测试
int main()
{
FILE* pf = fopen("test.txt", "w");
fputs("abcdef", pf); //先将代码放在输出缓冲区
printf("睡眠10秒-已经写数据了,打开test.txt文件,发现文件没有内容\n");
Sleep(10000);
printf("刷新缓冲区\n");
fflush(pf); //刷新缓冲区时,才将输出缓冲区的数据写到⽂件(磁盘)
//注:fflush 在⾼版本的VS上不能使⽤了
printf("再睡眠10秒-此时,再次打开test.txt文件,文件有内容了\n");
Sleep(10000);
fclose(pf);
//注:fclose在关闭⽂件的时候,也会刷新缓冲区
pf = NULL;
return 0;
}
这⾥可以得出⼀个结论:
因为有缓冲区的存在,C语言在操作文件的时候,需要做刷新缓冲区或者在文件操作结束的时候关闭文件。
如果不做,可能导致读写文件的问题。