【讨论】简析文件操作

   文件操作在程序设计中使用较多,常见操作有打开、读、写、关闭等。本文将讨论文件操作涉及的相关内容,以Linux平台为例。

1.  结构

   文件操作是应用程序访问文件系统的过程。下面简要讨论文件系统的结构,如图1所示。

图1	文件系统结构示意图

1       文件系统结构示意图

     应用程序通过文件描述符int fd访问文件,执行文件操作(如系统调用read)时,先从描述符表中找到文件对象,然后再找到索引节点(在open时,从磁盘的索引节点表中读取初始数据),索引节点记录了文件信息(时间、大小等)和文件数据对应的逻辑块号表

由块号表和文件对象中的偏移量,可得到目标逻辑块号,接着访问磁盘缓冲池(如图2所示),查找该块号对应的缓冲块。若没找到,则要通过磁盘驱动读取磁盘数据到空闲缓冲块,最后将缓冲块的相关数据拷贝到用户空间。

       文件系统将数据块部分以逻辑块为单位进行组织(逻辑空间)逻辑块的大小是扇区大小的整数倍,可为512102420484096字节等。访问磁盘时,磁盘驱动将块号转换为柱面号、磁道号、扇区号等参数,来访问磁盘。

图2	磁盘缓冲示意图

2       磁盘缓冲示意图

以如下代码为例,

//读取文件"/tmp/a.dat"偏移100字节处的20字节数据到buf中。

void fun1()

{

char buf[20];

int fd = open( "/tmp/a.dat", O_RDONLY );

lseek( fd, 100, SEEK_SET );

read( fd, buf, sizeof(buf));

close(fd);

}

1—open:从文件系统根目录”/”开始,逐级查找”/tmp/a.dat”的索引节点号。因为目录文件与普通文件不同,保存的是一组子文件名和索引节点号,如图3所示,因此根据文件名,很方便查找到对应的索引节点号。

       然后根据节点号,在索引节点缓冲池中查找目标索引节点,若没找到,则将节点数据从索引节点表读到内存(索引节点对象),再新建文件对象,来保存该索引节点指针,最后找到描述符表中的空表项,记录文件对象指针,并返回对应的数组下标值。

2—lseek:根据描述符fd,找到文件对象,调整“文件偏移量”字段的值。

3read:先找到描述符对应的文件对象和索引节点,然后查找逻辑块号,再从磁盘缓冲池中查找目标缓冲块,并拷贝数据到用户空间。

4close:释放fd对应的文件对象和索引节点,清空fd对应的描述符表项。

图3	目录文件结构示意图

3       目录文件结构示意图

2.      共享 

文件系统中的文件对象和索引节点对象,可以通过引用计数在同一进程或不同进程间共享。

以如下代码为例,对应的数据结构如图4所示。

int fd[6];

void main()

{

fd[0] = open( "a1.dat", O_RDONLY );

fd[1] = open( "a1.dat", O_RDONLY );

fd[2] = dup( fd[1] );

CreateThread( fun );           //创建线程

}

void fun()

{

fd[3] = open( "a1.dat", O_RDONLY );

fd[4] = open( "a2.dat", O_RDONLY );

       fd[5] = dup(fd[0]);

}

//调用fork创建子进程时,父进程的描述符表拷贝到子进程,对应文件对象的引用计数全部加1,相当于执行了dup操作。

图4	文件系统相关数据结构示意图

4       文件系统相关数据结构示意图

3.      模拟

接下来给出文件操作(openlseekreadwriteclose等)的简化模拟示意程序。

类型定义:

 

函数定义:

 

 4.      缓冲

 除了以上讨论的,直接通过系统调用来访问文件,C标准库还提供了缓冲访问方式。

以相同功能的代码为例,

void fun2()

{

char buf[20];

FILE* fp = fopen( "/tmp/a.dat", “r” );

fseek(fp, 100, SEEK_SET );

fread(buf, 1, sizeof(buf), fp);

fclose(fp);

}

fopenfread等库函数,使得应用程序与文件系统之间多了个中间层,如图5所示,库函数操作对象是FILE* fp,其中记录了对应的文件描述符。FILE结构的定义如下,

struct _iobuf {

        char *_ptr;                //缓冲区当前指针

        int   _cnt;                //缓冲区中的字符数

        char *_base;              //流缓冲区

        int   _flag;

        int   _file;                //文件描述符

        int   _charbuf;

        int   _bufsiz;            //缓冲区大小

        char *_tmpfname;

        };

typedef struct _iobuf FILE;

图5	缓冲访问方式示意图

5       缓冲访问方式示意图 

在缓冲方式下,应用程序跟流缓冲区交互,后者再与磁盘缓冲块交互,如图6所示。

流缓冲区的一个作用是,减少进程陷入内核的次数,从而节省了上下文切换的相关开销。

同样道理,磁盘缓冲块的作用是,减少访问磁盘设备的次数,从而节省访问磁盘的相关开销。

 

图6	文件操作交互示意图

6       文件操作交互示意图

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值