[Hive]JsonSerde使用指南

本文档详细介绍了如何在Hive中使用JsonSerde,包括注意事项、下载jar、处理数组、嵌套结构、坏数据处理、标量转数组以及映射Hive关键词等关键步骤。对于坏数据,JsonSerde提供了忽略错误的选项,但不适用于格式正确但不符合Hive范式的JSON。同时,JsonSerde能将标量字段转换为数组,且能映射Hive的保留关键词。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

注意:

 

重要的是每行必须是一个完整的JSON,一个JSON不能跨越多行,也就是说,serde不会对多行的Json有效。 因为这是由Hadoop处理文件的工作方式决定,文件必须是可拆分的,例如,Hadoop将在行尾分割文本文件。

 
  1. // this will work

  2. { "key" : 10 }

  3.  
  4. // this will not work

  5. {

  6. "key" : 10

  7. }

2. 下载Jar

使用之前先下载jar:

http://www.congiu.net/hive-json-serde/

如果要想在Hive中使用JsonSerde,需要把jar添加到Hive类路径中:

add jar json-serde-1.3.7-jar-with-dependencies.jar;

3. 与数组使用

源数据:

 
  1. {"country":"Switzerland","languages":["German","French","Italian"]}

  2. {"country":"China","languages":["chinese"]}

Hive表:

 
  1. CREATE TABLE tmp_json_array (

  2. country string,

  3. languages array<string>

  4. )

  5. ROW FORMAT SERDE 'org.openx.data.jsonserde.JsonSerDe'

  6. STORED AS TEXTFILE;

  7.  
  8. LOAD DATA LOCAL INPATH '/home/xiaosi/a.txt' OVERWRITE INTO TABLE tmp_json_array;

使用:<

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值