UNIX File System 实现

最新推荐文章于 2023-05-26 15:27:09 发布

zealscott

最新推荐文章于 2023-05-26 15:27:09 发布

阅读量1.4k

点赞数 1

CC 4.0 BY-SA版权

分类专栏： OperatingSystem 文章标签：文件系统操作系统

本文链接：https://blog.youkuaiyun.com/crazy_scott/article/details/80718442

本文详细介绍了实现一个基于UNIX标准的文件系统的过程，包括文件分配方法（如连续分配、链表结构、I-Node），目录结构，空闲块管理，以及使用C语言实现的文件系统API接口。文中还探讨了缓存策略，并提到了实验中遇到的问题和未来改进的方向，如优化空闲块查找算法和限制缓存区大小。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

title: UNIX File System 实现
tags:

Operating System
categories:
Operating System
随堂笔记
abbrlink: 48303
date: 2018-06-14 20:57:03

最后的大作业是实现一个文件系统，我以UNIX的文件系统为标准，实现了简单的文件系统和API接口。

本文的所有代码已经上传我的Github。

要求

设计一个文件系统，最多可以容纳5000个文件，设备容量为250MB,单个文件最大容量为50MB,提供目录树功能，文件名最长为50个字符，每块大小1KB。
本实验采用文件来模拟磁盘，采用dd命令创建文件，例如：dd if=/dev/zeroof=simulated_device bs=1024 count=250000将创建一个包含250000块文件名为simulated_device的文件。(这个文件可以满足测试程序中所有测试程序的空间需要)
本实验已经给出测试文件，最大测试文件为50M。

思考

实验要求很简单，就是实现一个普通的文件系统，而且实现方式不限，使用提供的write_block等接口来模拟低层的磁盘操作。
设计一个文件系统，最主要的是思考如何布局。无论什么文件系统，都要包含目录树、文件信息等功能。
文件的实现书上介绍了几种常见的方法：
- 连续分配
  - 最简单的分配方案，将每个文件存放在连续的磁盘数据块中。
  - 易于实现，性能不错，但会造成大量外碎片（在多个小文件的时候经常发生）
- 带有文件分配表的链表结构
  - 把每一个磁盘块中的链表指针抽取出来，单独组成一个表格，放在内存中。
  - 这样的坏处是整个文件分配表必须都放在内存，太占用空间。
- I-Node
  - 大名鼎鼎的i-node登场啦。此i-node节点列出了文件的属性和各个数据库的磁盘地址，在给定一个i-node之后，就能找到该文件的所有信息。
  - 只有当一个文件被打开时，才需要把它的i节点装入内存。
  - 当i-node存储的磁盘地址不够时，我们还可以使用多级间接块（indirect block）来描述更多的磁盘地址。
目录
- 相对来说，目录的实现就简单多了。目录也可以理解为一种特殊的文件，UNIX中的目录非常简单，每一项（entry）只包含文件名和i-node节点号两个信息。
空闲块管理
- 如何迅速知道磁盘中的空闲块以及剩余容量呢？
- 一种方法是使用链表，但会占用大量空间。
- 更常用的方法是使用位图（bitmap）来管理，已经分配的块用1表示，未分配的用0表示，每个块只占1个byte。
SuperBlock
- 我们还需要一个SuperBlock作为文件系统的初始块。它应该包含文件系统初始化信息、位图地址、根目录地址等等，以便让系统将文件系统加载进内存。

实现

本项目使用了SuperBlock、Bitmap，以及i-node来实现文件系统。

Superblock
- 是否初始化
- 磁盘剩余空间（用于快速访问，了解该文件是否能放入磁盘）
- bitmap信息（每个位图的使用情况）
- 存储在第一块block中，当初始化时自动加载。
Bitmap
- 按理来说，Bitmap中的每一个byte来代表一个块。但用byte操作不太直观，因此本项目使用short类型代替（会多浪费不少空间，但总占比空间依然不多）
- 由于我们由250000个块，本项目设计每个Bitmap包含500个块的位图信息，其余地址用于存储起始磁盘块地址、剩余块多少。
- 因此，我们需要500个Bitmap，存储在第2~501个磁盘块中。
Root目录
- Root目录也必须在文件系统初始化时加载和初始化，因此我们将它分配在502磁盘块上。
i-node
- 在每个i-node中，我们设计了以下属性：
- 文件大小
- 创建、修改时间
- 直接块（200个，可以存储200KB的信息）
- 一级间接块（1个，可以存储256KB的信息–一条地址4bytes）
- 二级间接块（1个，可以存储256*256KB的信息，完全足够我们用了）