MFS 简介
安装帮助文档:http://www.moosefs.org/reference-guide.html
mooseFS (moose 驼鹿)是一款网络分布式文件系统,它把数据分散在多台服务器上,但对于用户来讲,看到的只是一个源。MFS也像其他类 unix 文件系统一样,包含了层级结构(目录树),存储着文件属性(权限,最后访问和修改时间),可以创建特殊的文件(块设备、字符设备、管道、套接字),符号链接,硬链接.
MooseFS(MFS) 是一个具有容错性的网络分布式文件系统,它把数据分散存放在多个物理服务器上,而呈现给用户的则是一个统一的资源.
SAN 和 MFS 比较
- 当我们存储服务器的容量达到瓶颈之后,那我们就需要采用分布式的文件系统来扩大存储容量。类似百度云的存储,也是采用分布式存储.
MFS 特征
- 层次结构 (目录树)
- 存储文件属性(权限,访问和修改时间)
- 支持特殊文件(块设备、字符设备、管道)
- 符号链接,软硬链接
- 对文件系统访问可以通过 IP 地址或者密码进行访问限制
- 高可靠(数据的多个拷贝存储在不同的计算机上)
- 通过附加新的计算机或硬盘可以实现容量的动态扩展
- 删除文件可以根据可配置的时间周期进行保留
- 不受访问和写入影响的文件连贯快照
应用场景
- 说到 MooseFS 的应用场景,其实就是去 谈分布式文件系统的应用场景.
- 大规模高并发的数据存储访问(小文件,大文件)
- 大规模的数据处理,如日志分析.
MFS 分布式文件系统 部署方案
- MooseFS 是一种分布式文件系统,MooseFS 文件系统结构包括以下四种角色:
1 . 管理服务器 managing server (master):
负责各个数据存储服务器的管理,文件读写调度,文件空间回收以及恢复,多节点拷贝
2 . 元数据日志服务器 Metalogger server (Metalogger):
负责备份 master 服务器的变化日志文件,文件类型为 changelog_ml.*.mfs,以便在 master server 出问数据题的时候接替其进行工作
3 . 数据存储服务器 data servers (chunk servers):
听从管理服务器调度,提供存储空间,并为客户 提供数据传输,真正存储用户数据的服务器,存储文件时,首先把文件分成块,然后这些块在数据服务器 chunkserver 之间复制 (复制份数可以手工指定,建议设置副本数为3),数据服务器可以是多个,并且数量越多,可使用"磁盘空间"越大,可靠性越高.
4 . 客户机挂在使用 client computers:
客户端挂在远程 mfs 服务器共享的存储并使用. 通过 fuse 内核接口挂载进程管理服务器上所管理的数据存储服务器共享出的硬盘,共享的文件系统的用法和 nfs 相似。 使用 MFS文件系统来存储和访问的主机称为 MFS 的客户端,成功挂载 MFS 文件系统后,就可以像以前使用 NFS 一样共享这个虚拟性的存储了.
系统 部署方案
内部运行机制
- 客户端请求访问存储,请求发送到了 MFS Mastrt .
- MFS Master根据我们的请求,查询所需要的文件分布在那些服务器上 .
- 客户端直接和存储服务器进行数据存储和读写 .
端口号
- 9420 : MFS mastrt 和 MFS chunck 通信端口
- 9421 : MFS master 和 MFS Client 端通信端口
- 9419 : MFS master 和 MFS metalogger 端通信端口
- 9422 : MFS chunck 和 MFS Client 端通信端口
- 9425 : MFS master web 界面监听端口,查看系统整体运行状态