文件系统定义
- 文件系统是一种存储和组织数据的方法,实现了数据的存储、分级组织、访问和获取等操作,使得用户对文件访问和查找变得容易
- 文件系统使用树型目录的抽象逻辑概念替代了硬盘等物理设备使用数据块的概念,用户不必关心数据底层存在硬盘哪里,只需要纪柱这个文件的所属目录和文件名即可
- 文件系统通常使用硬盘和光盘这样的存储设备,并维护文件在设备中的物理位置
传统常见的文件系统
- 所谓传统常见的文件系统更多指的单机的文件系统,也就是底层不会横跨多台机器实现。
- 这些文件系统的共同特征包括:
- 带有抽象的目录树结构,树都是从/根目录开始往下蔓延
- 树中节点分为两类:目录和文件
- 从根目录开始,节点路径具有唯一性
数据、元数据
- 数据
指存储的内容本身,比如文件、视频、图片等,这些数据底层最终是存储在磁盘等存储介质上的,一般用户无需关心,只需要基于目录树进行增删改查即可,实际针对数据的操作由文件系统完成。 - 元数据
元数据(metadata)又称之为解释性数据,记录数据的数据
文件系统元数据一般指文件大小、最后修改时间、底层存储位置、属性、所属用户、权限等信息。
海量数据存储遇到的问题
- 成本高
传统存储硬件通用性差,设备投资加上后期维护、升级扩容的成本非常高。 - 如何支撑高效率的计算分析
传统存储方式意味着数据:存储是存储,计算是计算,当需要处理数据的时候把数据