hive处理json和url

本文介绍如何使用Hive内置函数处理JSON和URL数据,包括get_json_object和json_tuple函数解析JSON字段,以及parse_url和parse_url_tuple函数提取URL信息。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

HIVE直接读入json

样例:表test,字段json_str存储了json字符串

{ "firstName": "Brett", "lastName":"McLaughlin", "email": "aaaa" }
{ "firstName": "jesse", "lastName":"AJ", "email": "bb" }
  • get_json_object(jsonStr, kn)

        返回值: 一个key对应的一个字段

        说明:解析json的字符串jsonStr,若输入的json字符串无效,则返回NULL。

Hive处理语句:select get_json_object(json_str,'$.firstName') from test t

173855_VcNX_2812496.png

  • json_tuple(jsonStr, k1, k2, ...)

        返回值:多个key对应的多个字段

        说明:比 get_json_object 高效,可以在一次调用中输入多个键

HIVE处理语句:select json_tuple(json_str,'firstName','lastName','email') from test t

 

 

HIVE直接读入url

样例:表test1,字段url_str存储了url字符串

http://192.168.111.23:8888/filebrowser/view=/DB/lefuwx/test/part-m-00000
  • parse_url(url, partToExtract[, key])

        partToExtract选项[HOST,PATH,QUERY,REF,PROTOCOL,FILE,AUTHORITY,USERINFO]

Hive处理语句:select parse_url(url_str,'HOST') from .test1 t

  • parse_url_tuple(url, k1,k2..)

        partToExtract选项[HOST,PATH,QUERY,REF,PROTOCOL,FILE,AUTHORITY,USERINFO]

Hive处理语句:select parse_url_tuple(url_str,'HOST','PATH') from test1 t

转载于:https://my.oschina.net/puwenchao/blog/876278

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值