1. 背景
json 字符串值数据示例:
{
"score": 1,
"submitTime": 1712491933,
"answerFlag": 1,
"groupId": 1755547960,
"answers": [
{
"value": "[1, 2, 3]",
"ids": [
4,
5,
6
],
"isPic": 0,
"duration": 22314,
"status": 1,
"tid": 1
},
{
"value": "aabbcc",
"lessons": [
44,
55,
66
],
"isPic": 0,
"duration": 22314,
"status": 2,
"tid": 2
}
],
"questionType": 65
}
现在这个 json 字符串形式的字段值在 hive 表的某个字段中,我需要获取到 “answers” 这个 json 数组,然后将其按照数组长度,列转行到多行数据,每行数据一个子 json ,并且从中获取到每个子 json 的 “tid” 和 “status” 值,理想情况下,我需要这行数据处理完之后,结果如下表所示。
tid</ |
---|