示例,
| name | label |
| 张三 | A |
| 张三 | B |
| 张三 | C |
hive逻辑,
select name
,CONCAT_WS(',', SORT_ARRAY(COLLECT_SET(label))) as label_arr
from table_name
group by name
结果如下,
| name | label_arr |
| 张三 | A,B,C |
本文介绍了一种使用Hive SQL进行数据聚合的方法,通过CONCAT_WS和SORT_ARRAY函数组合,实现了将同一名称下的多个标签进行排序并合并为一个数组的功能。此方法适用于大数据场景下对标签类数据的高效处理。
示例,
| name | label |
| 张三 | A |
| 张三 | B |
| 张三 | C |
hive逻辑,
select name
,CONCAT_WS(',', SORT_ARRAY(COLLECT_SET(label))) as label_arr
from table_name
group by name
结果如下,
| name | label_arr |
| 张三 | A,B,C |
8587
3347

被折叠的 条评论
为什么被折叠?