目录
2. 解析JSON字符串的一个字段 get_json_object
3. 同时解析JSON字符串的多个字段 json_tuple
4. 解析不确定key的JSON,将key和value分别放入两列
前言
在工作中我们会经常遇到JSON格式的日志数据,本文来详细介绍在Hive中解析JSON字符串的函数:
1.get_json_object
2.json_tuple
1. 什么是JSON格式
这里直接上百度百科的解释:
JSON(JavaScript Object Notation, JS 对象简谱) 是一种轻量级的数据交换格式,采用完全独立于编程语言的文本格式来存储和表示数据。
对象和数组是比较特殊且常用的两种类型。
对象:对象在 JS 中是使用花括号包裹 {} 起来的内容,数据结构为 {key1:value1, key2:value2, ...} 的键值对结构。在面向对象的语言中,key 为对象的属性,value 为对应的值。键名可以使用整数和字符串来表示。值的类型可以是任意类型。
例如下面这样,其中user_id和platform是key,也就是我们要解析出来的列名,10000和ios是value,也就是我们要解析出来的数据内容:
{"user_id": "10000", "platform": "ios"}
数组:数组在 JS 中是方括号 [] 包裹起来