一、汇聚去重函数:collect_set
collect_set 函数用于数据去重,并将结果形成数组返回,而collect_list函数用于将结果形成数组,但是不去重。
(一)案例1:单列数据去重
1、创建数据文件nums.txt
100
200
350
100
250
200
100
350
250

本文详细介绍了Hive的内置函数collect_set和explode的使用方法,包括数据去重和行切分操作。通过多个案例,如单列数据去重、分组数据去重、行切分等,展示了如何在实际场景中应用这两个函数,以实现高效的数据处理和分析。
collect_set 函数用于数据去重,并将结果形成数组返回,而collect_list函数用于将结果形成数组,但是不去重。
100
200
350
100
250
200
100
350
250

1893

被折叠的 条评论
为什么被折叠?