Hive json数组转成多行

该内容涉及使用SQL对JSON格式的数据进行操作,包括提取特定字段如'id'、'status'和'jd_no',通过split、regexp_replace和regexp_extract等函数进行数据拆分和清洗。博客着重展示了如何在复杂JSON字符串中提取信息。
部署运行你感兴趣的模型镜像

 JSON格式文件:

[{"id":"1","status":"0","jd_no":"2424234333"},{"id":"10","status":"0","jd_no":"2424114333"},{"id":"3","status":"0","jd_no":"2124234333"},{"id":"4","status":"0","jd_no":"2424231233"},{"id":"5","status":"0","jd_no":"1224234333"},{"id":"7","status":"0","jd_no":"2424231233"}]

 

 

 

select  get_json_object(j_column,'$.id') as id,
get_json_object(j_column,'$.status') as status,
get_json_object(j_column,'$.jd_no') as jd_no

from
 
(SELECT split(regexp_replace(regexp_extract(t.json_column, '(\\[)(.*?)(\\])', 2), '\\},\\{', '\\}|\\{'), '\\|') AS json_column
FROM (
    SELECT '[{"id":"1","status":"0","jd_no":"2424234333"},{"id":"10","status":"0","jd_no":"2424114333"},{"id":"3","status":"0","jd_no":"2124234333"},{"id":"4","status":"0","jd_no":"2424231233"},{"id":"5","status":"0","jd_no":"1224234333"},{"id":"7","status":"0","jd_no":"2424231233"}]' AS json_column
) t
) a
lateral view explode(json_column) b as j_column;

 

您可能感兴趣的与本文相关的镜像

ACE-Step

ACE-Step

音乐合成
ACE-Step

ACE-Step是由中国团队阶跃星辰(StepFun)与ACE Studio联手打造的开源音乐生成模型。 它拥有3.5B参数量,支持快速高质量生成、强可控性和易于拓展的特点。 最厉害的是,它可以生成多种语言的歌曲,包括但不限于中文、英文、日文等19种语言

Hive 中,把数组拆分成多行可以使用 `explode` 函数和 `LATERAL VIEW` 结合的方法。以下为具体介绍: ### 基本使用场景 若有一个表 `user_hobbies`,其中包含 `user_id` 和 `hobbies` 字段,`hobbies` 是一个数组类型,存储了用户的多个爱好。 ```sql -- 创建表 CREATE TABLE user_hobbies ( user_id INT, hobbies ARRAY<STRING> ); -- 插入示例数据 INSERT INTO user_hobbies VALUES (1, array('reading', 'swimming', 'running')), (2, array('painting', 'dancing')); -- 使用 explode 函数拆分 hobbies 数组 SELECT user_id, hobby FROM user_hobbies LATERAL VIEW explode(hobbies) hobby_table AS hobby; ``` 在上述代码中,`LATERAL VIEW explode(hobbies) hobby_table AS hobby` 会将 `hobbies` 数组拆分成多行,每行包含一个爱好,同时保留对应的 `user_id`。 ### 解析 JSON 数组并拆分成多行数据JSON 数组时,需要先对 JSON 进行处理。数据存在表 `dev.woods_test` 中,解析 JSON 并将一行拆分成多行的 SQL 如下: ```sql SELECT a_json FROM ( SELECT split(regexp_replace(regexp_extract (json_col ,'(\\[)(.*?)(\\])',2),'\\},\\{','\\}|\\{'),'\\|') AS a_list FROM dev.woods_test ) a LATERAL VIEW explode(a_list) a_list_tab AS a_json; ``` 这里先通过 `regexp_extract` 提 JSON 数组内容,再使用 `regexp_replace` 替换特定字符,最后用 `split` 分割成数组,再用 `explode` 拆分成多行 [^2]。 ### 两数组转换多行 两个都是数组形式,且是对应关系,需要转换成多行才能按部门维度统计,示例如下: ```sql SELECT t1.*,dept_id1 AS level1_dept_id,dept_name2 AS level1_dept_name FROM ( SELECT * FROM dwd_ins_order_plan_line_info WHERE dt='2023-01-28' ) t1 LATERAL VIEW posexplode(split(order_type_department_id,',')) t AS dept_index1,dept_id1 LATERAL VIEW posexplode(split(order_type_department_name,',')) s AS dept_index2,dept_name2 WHERE dept_index1=dept_index2; ``` 这里使用 `posexplode` 函数,它不仅拆分数组,还会返回元素的位置索引,通过 `where` 子句确保两数组元素位置对应 [^4]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值