hive 合并同一列数据,并用某个字符分隔开

本文介绍了如何在ApacheHive3.1.3环境中使用SQL查询,包括合并具有相同数值的name列,以及使用concat_ws函数连接列表并处理NULL值,同时展示了collect_list和collect_set函数在数据去重中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

环境 apache-hive-3.1.3

1、原始数据

select num, name 
from test0422 
where num is not null;

在这里插入图片描述

2、把相同num值的name合并

select num, concat_ws('|||', collect_list(name) )
from test0422
where num is not null
group by num;

在这里插入图片描述

3、 concat_ws 函数

  • concat_ws 代表 concat with separator(分隔符),是 concat 的特殊形式。
  • 语法格式:concat_ws(separator, str1, str2, …) 。
  • 如有任何一个参数为 NULL ,则返回值为 NULL,可以考虑使用 nvl 函数将 NULL 替换为 ‘’ 。
select concat_ws(',', nvl(column1, ''), column2, column3);

4、collect_list 函数

  • collect_list 函数用于将多个值收集到一个列表中,不去重。
  • 语法格式:collect_list(expr) 。
  • expr 可以是任意数据类型。但是外层有 concat_ws 时必须 cast(expr as string)。

5、collect_set 函数

  • collect_set 函数用于将多个值收集到一个列表中,去重。
  • 语法格式:collect_set(expr) 。
  • expr 可以是任意数据类型。但是外层有 concat_ws 时必须 cast(expr as string)。
select num, concat_ws('-', collect_set(name) )
from test04222
where num is not null
group by num;

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值