shell系列-1.cat实现文件合并

最新推荐文章于 2024-04-28 06:34:53 发布

原创最新推荐文章于 2024-04-28 06:34:53 发布 · 2.5k 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#shell #cat #文件合并

shell 同时被 2 个专栏收录

4 篇文章

订阅专栏

编程语言

4 篇文章

订阅专栏

本文介绍了一种使用Shell脚本将HDFS中多个文件合并为单个文件的方法。包括创建工作区、获取HDFS文件及执行合并命令等步骤。

1.问题

描述：如何将某个目录下所有文件合并成单个文件（前提是相同schema文件，不同的话合并也没多大意义，当然你想这么做也没啥问题。）

2.解决方案

1）举例

从将hdfs上多日的数据汇总成一个单文件

2）shell版本解决方案

-首先，创建一个全新文件夹,并进入
>mkdir workspace
>cd workspace


-将文件get到本地,比如get这一年的数据（或者将你要进行合并的文件和文件夹都拷贝到workspace）
hadoop fs -get /user/data/dt=2017* .


-然后，workspace目录执行以下语句
find . -type f -exec cat {} \; > targetName.csv