Hadoop Archives 可以有效的处理以上问题,它可以把多个文件归档成为一个文件,归档成一个文件后还可以透明的访问每一个文件。
Usage: hadoop archive -archiveName name -p *
hadoop archive -archiveName test.har -p /input /outputdir
查看归档文件:hadoop fs -ls /outputdir/test.har
或 hdfs dfs -ls har:///test.har
HadoopArchives是一个工具,它可以将多个文件整合成一个归档文件,如test.har,同时仍能对每个原始文件进行透明访问。使用`hadooparchive`命令可创建归档,而`hadoopfs-ls`或`hdfsdfs-lshar`则用于查看归档内容。
Hadoop Archives 可以有效的处理以上问题,它可以把多个文件归档成为一个文件,归档成一个文件后还可以透明的访问每一个文件。
Usage: hadoop archive -archiveName name -p *
hadoop archive -archiveName test.har -p /input /outputdir
查看归档文件:hadoop fs -ls /outputdir/test.har
或 hdfs dfs -ls har:///test.har

被折叠的 条评论
为什么被折叠?