数据仓库——collect_set函数、NVL函数、日期处理

最新推荐文章于 2025-10-28 20:32:40 发布

原创最新推荐文章于 2025-10-28 20:32:40 发布 · 1.6k 阅读

CC 4.0 BY-SA版权

文章标签：

6 篇文章

订阅专栏

4 篇文章

订阅专栏

本文详细介绍SQL中的collect_set、nvl及日期处理函数的功能与应用场景。collect_set用于去重并组合数据，nvl用于处理空值，日期处理函数则帮助进行日期格式化与计算。

数据：

需求：对用户的订单进行分析，将不同订单类型分别多少单展示出来，每个用户一行

实现：

1.使用concat（）函数将order_type和order_number连接起来

concat（order_type,'(',order_number,')'）

2.使用concat_ws（）和collect_set（）进行合并行

将上面列表中一个user可能会占用多行转换为每个user占一行的目标表格式，实际是“列转行”

select user,concat_ws(',',collect_set(concat（order_type,'(',order_number,')'）)) order from table group by user

order是别名

作用：

NVL（表达式1，表达式2）

nvl是一个空值转换函数。

如果表达式1为空值，NVL返回值为表达式2的值，否则返回表达式1的值。该函数的目的是把一个空值（null）转换成一个实际的值。其表达式的值可以是数字型、字符型和日期型。但是表达式1和表达式2的数据类型必须为同一个类型。

应用场景：

可以设置字段如果为空的默认值。例如如果一个人在注册app时不填写用户名称时默认取你注册用的微信名称一样。
也可以用于外关联(join等)时两个表中有重复字段但是值不一样时，可以设置该字段取值的优先级别。例如两个事件表，一个是紧急事件表，另一个是基本事件表，两个表中都有一个字段名为事件紧急程度，这里我们就可以先将两个表进行关联，在设置事件紧急程度时首先取紧急事件表中该字段的内容，如果为空再取基本事件表中该字段的内容。