HDFS 高级存储特性详解(上)
在大数据存储领域,Hadoop 的 HDFS(Hadoop Distributed File System)凭借其高容错性、高扩展性等特点,成为了众多企业存储大规模数据的首选。本文将深入探讨 HDFS 的一些高级特性,包括快照、离线查看器、分层存储和纠删编码等,帮助你更高效地管理和利用 HDFS 存储。
1. HDFS 快照
HDFS 快照提供了一种简单的方式来保存文件或目录在某一时刻的副本。每行的第一个字符代表修改类型,具体如下表所示:
| 字符 | 修改类型 |
| ---- | ---- |
| + | 文件/目录已创建 |
| - | 文件/目录已删除 |
| M | 文件/目录已修改 |
| R | 文件/目录已重命名 |
需要注意删除和重命名的区别。如果重命名后的文件位于可快照目录之外,则视为删除;只有当文件保留在可快照目录中时,才视为重命名。不过,HDFS 快照不建议用作完整备份,因为它本质上仍是 HDFS 文件/目录,其容错性和可用性与普通 HDFS 文件/目录相同。完整备份需要更安全可靠的存储方式。HDFS 快照的完整说明可参考: http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-hdfs/HdfsSnapshots.html 。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



