1.“文件”的由来
一个程序的I/O指代了程序与外界的交互,包括文件、管道、网络、命令行、信号等。更广义地讲,I/O指代任何操作系统理解为“文件”的事务。许多操作系统,包括Linux和Windows,都将各种具有输入和输出概念的实体——包括设备、磁盘文件、命令行等——统称为文件,因此这里所说的文件是一个广义的概念。
对于一个任意类型文件,操作系统会提供一组操作函数,这包括打开文件、读文件、写文件、移动文件指针等,相信有编程经验的读者对此都不陌生。有过C语言编程经验的读者应该知道,C语言文件操作是通过了一个FILE结构的指针来进行的。fopen函数返回一个FILE结构的指针,而其他的函数如fwrite/fread使用这个这个指针操作文件。
2.“文件的实质”
在操作系统层面上,文件操作也有类似于FILE的一个概念,在Linux里,这叫做文件描述符(File Descriptor),而在Windows,叫做句柄(Handle)。实质上,文件描述符与句柄是一个相似的概念,都是用一个整形表示的value(以下在没有歧义的时候统称为句柄)。用户通过某个函数打开文件以获得句柄,此后用户操纵文件皆通过该句柄进行。
设计这么一个句柄的原因在于句柄可以防止用户随意读写系统内核的文件对象。无论是Linux还是Windows,文件句柄总是和内核的文件对象相关联的。内核可以通过句柄来计算出内核里文件对象的地址,但并不会把地址给用户。因为地址给你了,你可以利用指针对文件做任何事情,这个很危险。
下面举一个实际的例子,在Linux中,值为0,1,2的fd分别代表标准输入、标准输出和标准错误输出。在程序中打开文件得到的fd从3开始增长。fd具体是什么呢?在内核中,每一个进程都有一个私有的“打开文件表”,这个表是一个指针数组,每一个元素都指向一个内核的打开文件对象。而fd,就是这个表的下标。当用户打开一个文件时,内核会在内部生成一个打开文件对象,并在这个表里找到一个空项,让这一项指向生成的打开文件对象,并返回这一项的下标作为fd。由于这个表处于内核,用户无法访问到,因此用户即使拥有fd,也无法得到打开文件对象的地址,只能够通过系统提供的函数来操作。
在C语言里,操作文件的渠道则是FILE结构,不难想象,C语言中的FILE结构必定和fd有一对一的关系,每个FILE结构都会记录自己唯一对应的fd。
内核指针p指向该进程的打开文件表,所以只要有fd,就可以用p+fd来得到打开文件表的某一项地址。stdin、stdout、stderr均是FILE结构的指针。
对于Windows中的句柄,与Linux中的fd大同小异,不过Windows的句柄并不是打开文件表的下标,而是其下标经过某种线性变换之后的结果。
——From 《程序员的自我修养》