[Hive]JsonSerde使用指南

最新推荐文章于 2025-10-28 12:05:42 发布

原创

最新推荐文章于 2025-10-28 12:05:42 发布 · 686 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文档详细介绍了如何在Hive中使用JsonSerde，包括注意事项、下载jar、处理数组、嵌套结构、坏数据处理、标量转数组以及映射Hive关键词等关键步骤。对于坏数据，JsonSerde提供了忽略错误的选项，但不适用于格式正确但不符合Hive范式的JSON。同时，JsonSerde能将标量字段转换为数组，且能映射Hive的保留关键词。

注意：

重要的是每行必须是一个完整的JSON，一个JSON不能跨越多行，也就是说，serde不会对多行的Json有效。因为这是由Hadoop处理文件的工作方式决定，文件必须是可拆分的，例如，Hadoop将在行尾分割文本文件。

// this will work
{ "key" : 10 }
// this will not work
{
"key" : 10
}

2. 下载Jar

使用之前先下载jar：

http://www.congiu.net/hive-json-serde/

如果要想在Hive中使用JsonSerde，需要把jar添加到Hive类路径中：

add jar json-serde-1.3.7-jar-with-dependencies.jar;

3. 与数组使用

源数据：

{"country":"Switzerland","languages":["German","French","Italian"]}
{"country":"China","languages":["chinese"]}

Hive表：

CREATE TABLE tmp_json_array (
country string,
languages array<string>
)
ROW FORMAT SERDE 'org.openx.data.jsonserde.JsonSerDe'
STORED AS TEXTFILE;
LOAD DATA LOCAL INPATH '/home/xiaosi/a.txt' OVERWRITE INTO TABLE tmp_json_array;

使用：<

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。