Hive中将数据一行转多行、多行转一行、再转为以逗号分隔的string类型
背景
表content中有观看内容id(content_id),内容标签id列表(tag_id_list),如下所示:
content_id | tag_id_list |
---|---|
1 | 1000,1001,1002 |
2 | 1000,1003 |
3 | 1002,1003 |
4 | 1002,1004 |
表id_decode中有内容标签id(tagid),内容标签中文(tagname),如下所示:
tagid | tagname |
---|---|
1000 | 游戏 |
1001 | 吃鸡 |
1002 | 精彩操作 |
1003 | 王者荣耀 |
1004 | 大神 |
目标:将原来content表中的内容标签id列表字段转换成内容标签中文列表。
Step 1:将content表的tag_id_list一行转多行
使用la