分布式文件系统概述
-
本地文件管理
通常包含四类信息:- 超级块:含有整个文件系统中数据块和inode的相关信息
- Inode:用来描述文件和目录的属性和文件块在块设备上的位置信息
- 文件内容:用户的数据,是无结构
- 目录内容:是目录项,是结构
-
分布式文件系统
实现分布式文件系统的两种方法:共享文件系统、共享磁盘
在共享磁盘模型中,系统中没有文件服务器,而代之以共享磁盘。共享磁盘往往是一种专用的高端存储设备,如IBM SSA 磁盘。
分布式文件系统基本架构
主要服务器包括:
主控服务器:负责整个文件系统的管理,包括命名空间的维护、数据服务器管理、服务调度等。
数据服务器:负责数据的存储和备份,包括数据本地存储、状态维护、副本管理等。
客户端:主要有两个作用
- 接口,用户最终通过文件系统提供的接口来存取数据
- 缓存,为加速文件存取过程,同时减少主控服务器的负担,将元信息进行缓存
GFS分布式文件系统
是一个面向大规模数据处理的分布式文件系统
数据块大小64MB
实现流程:
- 客户端将文件名和程序指定的字节偏移,根据固定的block大小,转换成文件的block索引
- 客户端把文件名和block索引发送给master节点。Master节点将相应的block表示和副本的位置发给客户端。客户端用文件名和block索引