hadoop的归档文件(archive)——har。
目的:减少大量小文件。
- 归档
hadoop archive -archiveName files.har -p /my/files /my
将/my/files归档后放于/my下。
- 显示归档文件
hadoop fs -ls -R har:///user/bee/foo.har
归档文件一旦创建便不能修改,想从中增加或删除文件,必须重新归档。
本文详细介绍了Hadoop归档文件(HAR)的使用方法,旨在通过归档减少大量小文件,提高Hadoop系统的效率。文章讲解了如何使用hadooparchive命令进行文件归档,以及如何查看已归档的文件列表。需要注意的是,归档文件一旦创建便不能修改,若需增删文件,必须重新归档。
hadoop的归档文件(archive)——har。
目的:减少大量小文件。
hadoop archive -archiveName files.har -p /my/files /my
将/my/files归档后放于/my下。
hadoop fs -ls -R har:///user/bee/foo.har
归档文件一旦创建便不能修改,想从中增加或删除文件,必须重新归档。
1504
700

被折叠的 条评论
为什么被折叠?