HDFS受限于Block大小,大文件会分割成多个块分布在多个节点,导出本地的时候直接用:
hadoop fs -get
命令会在本地创建一个目录存放多个块。
要想合并为一个大文件可以这样:
hadoop fs -getmerge hdfs:///user/nixm/news_rank1.txt /nixm/gcy/out1.txt
本文介绍了HDFS中如何将被分割成多个块的大文件合并为单一文件的方法。使用hadoop fs -getmerge命令可以在本地创建完整文件,避免了手动合并各个块的繁琐过程。
HDFS受限于Block大小,大文件会分割成多个块分布在多个节点,导出本地的时候直接用:
hadoop fs -get
命令会在本地创建一个目录存放多个块。
要想合并为一个大文件可以这样:
hadoop fs -getmerge hdfs:///user/nixm/news_rank1.txt /nixm/gcy/out1.txt
597
458
5976
6361

被折叠的 条评论
为什么被折叠?