文件的物理结构
文件的分配方式
在内存管理中,进程的逻辑地址空间被分为一个一个的页面,同样的,在外存管理中,为了方便对文件数据的管理,文件的逻辑地址空间也被分为了一个个的文件“块”。
文件的逻辑地址表示为逻辑块号、块内地址的形式。
连续分配
要求每个文件在磁盘上占有一组连续的块。
假设现在用户已经给出了要访问文件的逻辑块号,操作系统找到该文件对应的FCB(文件控制块中含有文件的起始地址和长度),然后物理块号=起始块号+逻辑块号。 当然在计算值钱要验证逻辑块号的合法性,当逻辑块号小于块长度才能代入计算出物理块号。
优点
- 连续分配可以直接算出逻辑块号对应的物理块号,因此连续分配支持顺序访问和直接访问。
- 连续分配的文件在磁盘读写的时候速度最快。
缺点
连续分配的文件在外存上不方便拓展。存储空间利用率低,会产生磁盘碎片。
链接分配
隐式链接
每个文件目录项中(FCB)记录了起始块号和结束块号,除最后一个磁盘块外,其余的多了一个文件指针,这个文件指针永远指向下一个磁盘块,这些指针对用户来说是不可见的。这就是隐式链接。
隐式链接这样做只支持顺序访问,不支持随机访问。(类比数据结构中的链表)查找效率低,另外指向下一个盘块需要额外的存储空间。
优点
很方便文件拓展,不会有碎片问题,外存利用率高。
缺点
只支持顺序访问,不支持随机访问,查找效率低,指向下一个盘块的指针也需要耗费少量的存储空间。
显示链接
把用于链接文件各个物理块的指针显示的放在一张表中,即文件分配表(FAT)。一个磁盘只会建立一张文件分配表。开机时文件分配表放在内存,并常住内存。
优点
很方便文件拓展,不会有碎片问题,外存利用率高,并且支持随机访问。相比于隐式链接来说。地址转换时不需要访问磁盘,因此文件的访问效率更高。
缺点:文件分配表需要占用一定的存储空间。
索引分配
索引分配允许文件离散地分配在各个磁盘块中,系统会为每个文件建立一张索引表,索引表中记录了文件的各个逻辑块对应的物理块(索引表的功能类似于内存管理中的页表一一建立逻辑页面到物理页之间的映射关系)。索引表存放的磁盘块称为索引块。文件数据存放的磁盘块称为数据块。
若文件太大,索引表项太多,可以采取以下三种方法解决:
1、链接方案:如果索引表太大,一个索引块装不下,那么可以将多个索引块链接起来存放。缺点:若文件很大,索引表很长,就需要将很多个索引块链接起来。想要找到ⅰ号索引块,必须先依次读入0~i-1号索引块,这就导致磁盘0次数过多,查找效率低下。
2、多层索引:建立多层索引(原理类似于多级页表)。使第一层索引块指向第二层的索引块。还可根据文件大小的要求再建立第三层、第四层索引块。采用K层索引结构,且顶级索引表未调入内存,则访问一个数据块只需要κ+1次读磁盘操作。缺点:即使是小文件,访问一个数据块依然需要κ+1次读磁盘。
3、混合索引:多种索引分配方式的结合。例如,一个文件的顶级索引表中,既包含直接地址索引(直接指向数据块),又包含一级间接索引(指向单层索引表)、还包含两级间接索引(指向两层索引表)。
优点:对于小文件来说,访问一个数据块所需的读磁盘次数更少。
超级超级超级重要考点:
- 要会根据多层索引、混合索引的结构计算出文件的最大长度(Key:各级索引表最大不能超过一个块);
- 要能自己分析访问某个数据块所需要的读磁盘次数(Key:FCB中会存有指向顶级索引块的指针,因此可以根据FCB读入顶级索引块。每次读入下一级的索引块都需要一次读磁盘操作。另外,要注意题目条件一一顶级索引块是否已调入内存)
总结
文件的逻辑结构
文件的属性
文件名