[Hive_add_10] Hive 的 serde (序列化 & 反序列化) 操作

本文深入探讨了Hive中SerDe的重要概念,包括OpenCSVSerde用于处理CSV文件,以及JsonSerDe用于解析JSON数据。通过具体实例展示了如何创建表并指定SerDe,以及加载和查询数据的过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


0. 说明

  serde 是序列化和反序列化 serialize & deserialize

  是将文件中的字段映射成 Hive 中的列

 

 


1. 验证

  1.1 openCSVSerde

  CSV 为逗号分隔的文件

create table serde_csv (id int, name string , age int)
row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde' 
stored as textfile;

create table serde_csv2 (id int, name string , age int)
row format delimited
fields terminated by ',' 
stored as textfile;

 

  1.2 jsonSerde

  将 json 数据映射成列数据

  1. 准备 1.json 和 json-serde

 

  2. 部署 json-serde
  将 json-serde-1.3.8-jar-with-dependencies.jar 放置在 /soft/hive/lib 下并重启 Hive

  3. 创建表并指定表 serde   //以反引号作为解析字段``

create table json(`_location` string,`_ip` string,`_action` string, `_uid` string, `_timestamp` string) 
ROW FORMAT SERDE 'org.openx.data.jsonserde.JsonSerDe'
stored as textfile;

 

  4. 加载数据

load data local inpath '/home/centos/files/1.json' into table json;

 

  5. 查询验证

select * from json;

 

 

 

 

 


 

转载于:https://www.cnblogs.com/share23/p/10260507.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值