用nifi把hdfs数据导到hive

本文介绍如何使用ListHDFS和FetchHDFS进行文件管理,通过EvaluateJsonPath解析JSON数据,并利用RouteOnContent和ReplaceText处理内容。此外还详细说明了如何将处理后的数据插入到Hive表中。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

全景图:

NewImage 

 

1. ListHDFS & FetchHDFS:

ListHDFS:

NewImage

 

FetchHDFS:

NewImage

 

2. EvaluateJsonPath:

{"status": {"code":500,"message":"FAILED","detail":"DTU ID not exists"}}

NewImage

如果json里有数组,需要先用SplitJson分隔:

NewImage

 

 

3. RouteOnContent:

NewImage

 

4. ReplaceText:

先在hive里创建一个表:

create table tb_test(
register string,
register_url string
);

1
  
NewImage
1
insert into yongli.tb_test(register, register_url)values('${register}','${register_url}')
1
  
1
  

下面介绍一种效率更高的方式:

1
还是用ReplaceText:

NewImage

1
  
1
再用MergeContent:

NewImage

1
insert into yongli.tb_dtu(dtuid, addr, value, time)values

 

5. PutHiveQL:

创建一个HiveConnectionPool

NewImage

 

设置Database Connection URL, User, Password:

NewImage

 

 

 

本文转自疯吻IT博客园博客,原文链接:http://www.cnblogs.com/fengwenit/p/5823177.html,如需转载请自行联系原作者


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值