SQL Server 函数 CASE WHEN, ROW_NUMBER OVER, CAST, CONVERT, LEFT, RIGHT 数据处理

最新推荐文章于 2025-09-01 14:32:18 发布

程序才子

最新推荐文章于 2025-09-01 14:32:18 发布

阅读量296

点赞数 1

CC 4.0 BY-SA版权

文章标签：数据库 java servlet 大数据

本文链接：https://blog.youkuaiyun.com/TechWhiz/article/details/132546848

大数据专栏收录该内容

182 篇文章 ¥59.90 ¥99.00

订阅专栏

本文详细介绍了 SQL Server 中的 CASE WHEN, ROW_NUMBER OVER, CAST, CONVERT, LEFT 和 RIGHT 函数，通过实例展示了如何使用它们进行数据处理和转换。CASE WHEN 实现条件分支，ROW_NUMBER OVER 用于行编号，CAST 和 CONVERT 进行数据类型转换，LEFT 和 RIGHT 则用于字符串截取。这些函数在数据库操作中至关重要，能有效提升数据处理效率。" 130279264,10794535,Vue 3深入实践：异步组件与代码拆分技巧,"['vue.js', '前端开发', 'javascript', '代码优化']

SQL Server 函数 CASE WHEN, ROW_NUMBER OVER, CAST, CONVERT, LEFT, RIGHT 数据处理

在 SQL Server 数据库中，有许多函数可用于数据处理和转换。本文将重点介绍 SQL Server 中的几个常用函数，包括 CASE WHEN、ROW_NUMBER OVER、CAST、CONVERT、LEFT 和 RIGHT。通过示例源代码，我们将详细说明每个函数的使用方法。

一、CASE WHEN 函数

CASE WHEN 函数用于根据条件对数据进行分支处理。它可以根据不同的条件返回不同的结果。以下是 CASE WHEN 函数的语法：

CASE
    WHEN condition1 THEN result1
    WHEN condition2 THEN result2
    ...
    ELSE result

了解本专栏

订阅专栏解锁全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

程序才子

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

订阅专栏

SQLServer函数case when，ROW_NUMBER() OVER()，CAST，CONVERT，LEFT，RIGHT

zhengzaifeidelushang的博客

09-23

765

SQLServer函数case when，CAST，CONVERT，DATEADD，DATEPART 一、case when函数 case函数只返回第一个符合条件的值，剩下的case部分将会被自动忽略。简单case函数 CASE name when 'yf' then 'love' when 'qq' then 'qianqian' when 'lb' then 'liubei' else 'error' END as name 示例： SELECT stuID, CASE name

SQLServer Case When Then 多条件判断使用

旭东怪的博客

08-09

1万+

1 Case ...When ... Then ... End 语法： Case sex When 1 Then '男’ When 2 Then '女' End 实例： sex（性别）为1代表男，为2代表女。 select username ,pickname ,Case sex When 1 Then '男’ When 2 Then '女' End As sexName from users 2 C...

参与评论您还未登录，请先登录后发表或查看评论

【数据库】Sql Server数据库中isnull、iif、case when三种方式的使用和空值判断

小5聊的博客

09-01

2290

有时候数据库你接触多了，就会知道一些技巧，说实在有时候博主没有接触到，我可能还是会用普通方式去判断，这样就会存在漏数据的情况。所以，平时去积累一些技巧还是非常有必要的。

SqlServer使用 case when 解决多条件模糊查询问题

12-15

我们在进行项目开发中，经常会遇到多条件模糊查询的需求。对此，我们常见的解决方案有两种：一是在程序端拼接SQL字符串，根据是否选择了某个条件，构造相应的SQL字符串；二是在数据库的存储过程中使用动态的SQL语句。其本质也是拼接SQL字符串，不过是从程序端转移到数据库端而已。这两种方式的缺点是显而易见的：一是当多个条件每个都可为空时，要使用多个if语句进行判断；二是拼接的SQL语句容易产生SQL注入漏洞。最近写数据库存储过程的时候经常使用case when 语句，正好可以用这个语句解决一下以上问题。以SQL中的NorthWind数据库为例，我要操作的是其中的Employees表，该表中默认

SQL SERVER case when的使用方法

gangli_8的博客

06-06

1万+

SQL SERVER case when的使用方法，横表转竖表，分组等等。

sqlserver中case when使用

爱编程

12-13

614

select distinct a.billno,a.stepname,a.dealname, CASE a.dealremark WHEN '同意' THEN 'NULL' ELSE dealremark END dealremark, CASE a.dealresult WHEN '1' THEN '通过' WHEN '2' TH...

用友u8V13连企业ERP使用row_number()函数比使用游标速度快几百倍

weixin_42351710的博客

03-05

676

用友u8V13连企业ERP使用row_number()函数比使用游标速度快几百倍本公司使用的是行业专用ERP，但财务又用得是用友u8v13.0。ERP数据转用友财务时，通过另写中间接口。大多数是每月月初会把ERP的销售、采购发票、存货档案、进入仓单据导入用友财务系统。以存货档案来说，之前使用游标写接口，大概需要30分~50分钟，后面实在受不了这个速度，也没有想到不用游标的好技术。后来突然想到...

SQLServer常用运维SQL整理（2）

weixin_65034883的博客

08-03

1049

SQLServer常用运维SQL整理（2）

《SQL基础教程（第2版）Oracle》——函数、谓词、CASE表达式、窗口函数、GROUPING运算符

qq_44883214的博客

09-28

1387

内容很多，有问题发评论区。

Case when的用法

热门推荐

mry6的博客

07-10

20万+

Case when 的用法: 一旦满足了某一个WHEN, 则这一条数据就会退出CASE WHEN , 而不再考虑其他CASE; Case when 的用法 -- 搜索Case函数: Case函数(Case搜索函数): 判断表达式的真假,如果为真,返回结果;如果为假,返回else值;如果未定义else值,则返回空值(使用条件确定返回值); select name,id,(case wh...

SQL Server---Case When用法简介

weixin_34335458的博客

04-23

670

Casewhen 用法简介上一篇博客使用了casewhen解决了数据汇总的问题，那么这一篇博客我将简单的介绍一下关于case when的使用。 CASEWHEN的表达形式 1、简单的case函数 --简单Case函数 CASE letterType WHEN '干...

【项目实战】---SQLServer中case when的简单用法

一路向前！

12-03

6125

前言：对于SqlServer中case when 的应用在项目中进行了应用，现在做个简单的总结。 SqlServer case when 语句有两种语法

sql server case when用法

weixin_42601134的博客

02-18

444

SQL Server的CASE WHEN语句是一种条件判断语句，它可以根据某个列的值的不同来返回不同的结果。它的用法如下：CASE WHEN 条件1 THEN 结果1 WHEN 条件2 THEN 结果2 ELSE 结果3 END。 ...

SQL Server学习之路(三)

SQL数据库开发

01-29

615

今天给大家说下工作中经常使用的一个关键字：CASE。说起CASE还得从我刚进入第一家公司的面试说起。第一家公司是我第一次面试公司，当时还是有点小紧张。在和HR沟通之后，就...

sql server 学习--case when 记录

u010546789的博客

08-27

274

case when 用语更新表中： update [dbo].[score] set number=case when number >70 then number-10 when number>60 and number <=70 then number*1.5 when number <=60 then number * 0.8 else number end; ca...

SQLServer_case_when_存在即是

icecoola_的博客

06-12

1601

select top 1 case isYes when '是' then '是' else '否' end from t_table where t_id=tid and isYes= '是' 有问题 ; 无法显示否 isYes 是否 null 显示是否 select top 1 case when count(1)>0 then '是' else '否' en...

sql server case when

weixin_30501857的博客

03-10

129

case具有两种格式：简单Case函数和Case搜索函数简单case函数实例:CASE sex when '1' then '男' when '2' then'女' else '其他' end Case搜索函数实例: CASE WHEN sex = '1' THEN '男' WHEN sex = '2' THEN '女'...

Sql Server case when语句

平行宇宙i的博客

04-02

5497

Case具有两种格式。简单Case函数和Case搜索函数。 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN '男' WHEN sex = '2' THEN '女' ...

SQL Server：使用带有 WHERE 子句的 CASE WHEN 表达式

4G/5G随身WiFi专业DIY改装

09-02

1560

在 SQL Server 中，你可以使用带有WHERE子句的CASE WHEN表达式来根据条件进行不同的操作。以下是一个示例，展示了如何使用这种表达式：登录后复制 SELECT CASE WHEN condition1 THEN result1 WHEN condition2...

-- ******************************************************************** -- -- Author: 蔡义 -- CreateTime: 2025-09-11 -- Comment: 扩展用户常听歌曲序列的side_info信息表 - 性能优化版 -- 优化策略: 热点用户识别+分层处理+动态盐值 -- ******************************************************************** -- -- 设置优化参数 SET hive.map.aggr=true; SET hive.map.aggr.hash.percentmemory=0.5; SET hive.groupby.skewindata=true; SET hive.optimize.skewjoin=true; SET hive.skewjoin.key=100000; SET hive.exec.reducers.bytes.per.reducer=256000000; SET hive.exec.reducers.max=999; SET hive.auto.convert.join=true; SET hive.mapjoin.smalltable.filesize=100000000; SET mapreduce.map.memory.mb=4096; SET mapreduce.reduce.memory.mb=8192; SET hive.exec.parallel=true; SET hive.exec.parallel.thread.number=8; -- 建表语句（保持不变） CREATE TABLE IF NOT EXISTS music_most.user_song_sequence_with_side_info ( user_id STRING COMMENT '用户ID', user_often_listen_song_id_list_7d ARRAY COMMENT '用户7天常听的歌曲ID列表', user_often_listen_song_name_list_7d ARRAY COMMENT '用户7天常听的歌曲名称列表', user_often_listen_artist_id_list_7d ARRAY COMMENT '用户7天常听歌曲的艺人ID列表', user_often_listen_artist_name_list_7d ARRAY COMMENT '用户7天常听歌曲的艺人名称列表', user_often_listen_genre_list_7d ARRAY COMMENT '用户7天常听歌曲的曲风列表', user_often_listen_language_list_7d ARRAY COMMENT '用户7天常听歌曲的语种列表', user_often_listen_play_cnt_list_7d ARRAY COMMENT '用户7天常听歌曲的播放次数列表', user_often_listen_duration_list_7d ARRAY COMMENT '用户7天常听歌曲的时长列表(毫秒)', user_often_listen_song_id_list_30d ARRAY COMMENT '用户30天常听的歌曲ID列表', user_often_listen_song_name_list_30d ARRAY COMMENT '用户30天常听的歌曲名称列表', user_often_listen_artist_id_list_30d ARRAY COMMENT '用户30天常听歌曲的艺人ID列表', user_often_listen_artist_name_list_30d ARRAY COMMENT '用户30天常听歌曲的艺人名称列表', user_often_listen_genre_list_30d ARRAY COMMENT '用户30天常听歌曲的曲风列表', user_often_listen_language_list_30d ARRAY COMMENT '用户30天常听歌曲的语种列表', user_often_listen_play_cnt_list_30d ARRAY COMMENT '用户30天常听歌曲的播放次数列表', user_often_listen_duration_list_30d ARRAY COMMENT '用户30天常听歌曲的时长列表(毫秒)', user_often_listen_song_id_list_90d ARRAY COMMENT '用户90天常听的歌曲ID列表', user_often_listen_song_name_list_90d ARRAY COMMENT '用户90天常听的歌曲名称列表', user_often_listen_artist_id_list_90d ARRAY COMMENT '用户90天常听歌曲的艺人ID列表', user_often_listen_artist_name_list_90d ARRAY COMMENT '用户90天常听歌曲的艺人名称列表', user_often_listen_genre_list_90d ARRAY COMMENT '用户90天常听歌曲的曲风列表', user_often_listen_language_list_90d ARRAY COMMENT '用户90天常听歌曲的语种列表', user_often_listen_play_cnt_list_90d ARRAY COMMENT '用户90天常听歌曲的播放次数列表', user_often_listen_duration_list_90d ARRAY COMMENT '用户90天常听歌曲的时长列表(毫秒)', total_play_count_7d BIGINT COMMENT '7天总播放次数', total_play_count_30d BIGINT COMMENT '30天总播放次数', total_play_count_90d BIGINT COMMENT '90天总播放次数', distinct_song_count_7d BIGINT COMMENT '7天独立歌曲数', distinct_song_count_30d BIGINT COMMENT '30天独立歌曲数', distinct_song_count_90d BIGINT COMMENT '90天独立歌曲数', update_time STRING COMMENT '数据更新时间' ) COMMENT '用户常听歌曲序列扩展side_info表（7天/30天/90天窗口）' PARTITIONED BY (dt STRING COMMENT '时间分区yyyy-mm-dd') STORED AS PARQUET TBLPROPERTIES ( 'PARTITION_LIFECYCLE'='30d', 'table.source'='自定义', 'table.creator'='caiyi05@corp.netease.com' ); -- 优化版数据插入 INSERT OVERWRITE TABLE music_most.user_song_sequence_with_side_info PARTITION(dt='${bizdate_1}') WITH -- ========== 步骤1: 识别热点用户（基于最近一天数据快速识别） ========== -- hot_users AS ( SELECT /+ MAPJOIN / user_id, COUNT() as record_count FROM music_most.user_song_daily_with_side_info WHERE dt = '${bizdate_1}' GROUP BY user_id HAVING COUNT() > 2000 -- 热点用户阈值 ), -- ========== 步骤2: 处理7天窗口 ========== -- -- 2.1 普通用户7天数据（不加盐） normal_user_7d AS ( SELECT t1.user_id, t1.song_id, MAX(t1.song_name) as song_name, MAX(t1.singer_artist_id_list) as singer_artist_id_list, MAX(t1.singer_artist_name_list) as singer_artist_name_list, MAX(t1.genre_tag_name) as genre_tag_name, MAX(t1.norm_language) as norm_language, MAX(t1.duration) as duration, SUM(t1.effective_play_cnt_1d) as play_count FROM music_most.user_song_daily_with_side_info t1 LEFT ANTI JOIN hot_users t2 ON t1.user_id = t2.user_id WHERE t1.dt BETWEEN date_sub('${bizdate_1}', 6) AND '${bizdate_1}' AND t1.effective_play_cnt_1d > 0 GROUP BY t1.user_id, t1.song_id ), -- 2.2 热点用户7天数据（加盐处理） hot_user_7d_salted AS ( SELECT CASE WHEN t2.record_count > 10000 THEN CONCAT(t1.user_id, '', CAST(RAND() * 50 AS INT)) WHEN t2.record_count > 5000 THEN CONCAT(t1.user_id, '', CAST(RAND() * 30 AS INT)) ELSE CONCAT(t1.user_id, '_', CAST(RAND() * 20 AS INT)) END as user_id_salt, t1.user_id, t1.song_id, t1.song_name, t1.singer_artist_id_list, t1.singer_artist_name_list, t1.genre_tag_name, t1.norm_language, t1.duration, t1.effective_play_cnt_1d FROM music_most.user_song_daily_with_side_info t1 INNER JOIN hot_users t2 ON t1.user_id = t2.user_id WHERE t1.dt BETWEEN date_sub('${bizdate_1}', 6) AND '${bizdate_1}' AND t1.effective_play_cnt_1d > 0 ), -- 2.3 热点用户第一阶段聚合 hot_user_7d_stage1 AS ( SELECT user_id_salt, user_id, song_id, MAX(song_name) as song_name, MAX(singer_artist_id_list) as singer_artist_id_list, MAX(singer_artist_name_list) as singer_artist_name_list, MAX(genre_tag_name) as genre_tag_name, MAX(norm_language) as norm_language, MAX(duration) as duration, SUM(effective_play_cnt_1d) as partial_play_count FROM hot_user_7d_salted GROUP BY user_id_salt, user_id, song_id ), -- 2.4 热点用户第二阶段聚合（去盐） hot_user_7d AS ( SELECT user_id, song_id, MAX(song_name) as song_name, MAX(singer_artist_id_list) as singer_artist_id_list, MAX(singer_artist_name_list) as singer_artist_name_list, MAX(genre_tag_name) as genre_tag_name, MAX(norm_language) as norm_language, MAX(duration) as duration, SUM(partial_play_count) as play_count FROM hot_user_7d_stage1 GROUP BY user_id, song_id ), -- 2.5 合并7天数据 user_song_7d AS ( SELECT * FROM normal_user_7d UNION ALL SELECT * FROM hot_user_7d ), -- 2.6 7天排序和聚合 user_song_7d_ranked AS ( SELECT user_id, song_id, play_count, song_name, singer_artist_id_list, singer_artist_name_list, genre_tag_name, norm_language, duration, ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY play_count DESC, song_id) as rank FROM user_song_7d ), user_song_7d_agg AS ( SELECT user_id, collect_list(CASE WHEN rank <= 100 THEN song_id END) as user_often_listen_song_id_list_7d, collect_list(CASE WHEN rank <= 100 THEN song_name END) as user_often_listen_song_name_list_7d, collect_list(CASE WHEN rank <= 100 THEN singer_artist_id_list END) as user_often_listen_artist_id_list_7d, collect_list(CASE WHEN rank <= 100 THEN singer_artist_name_list END) as user_often_listen_artist_name_list_7d, collect_list(CASE WHEN rank <= 100 THEN genre_tag_name END) as user_often_listen_genre_list_7d, collect_list(CASE WHEN rank <= 100 THEN norm_language END) as user_often_listen_language_list_7d, collect_list(CASE WHEN rank <= 100 THEN play_count END) as user_often_listen_play_cnt_list_7d, collect_list(CASE WHEN rank <= 100 THEN duration END) as user_often_listen_duration_list_7d, SUM(CASE WHEN rank <= 100 THEN play_count ELSE 0 END) as total_play_count_7d, COUNT(DISTINCT CASE WHEN rank <= 100 THEN song_id END) as distinct_song_count_7d FROM user_song_7d_ranked WHERE rank <= 100 GROUP BY user_id ), -- ========== 步骤3: 处理30天窗口（复用相同逻辑） ========== -- normal_user_30d AS ( SELECT t1.user_id, t1.song_id, MAX(t1.song_name) as song_name, MAX(t1.singer_artist_id_list) as singer_artist_id_list, MAX(t1.singer_artist_name_list) as singer_artist_name_list, MAX(t1.genre_tag_name) as genre_tag_name, MAX(t1.norm_language) as norm_language, MAX(t1.duration) as duration, SUM(t1.effective_play_cnt_1d) as play_count FROM music_most.user_song_daily_with_side_info t1 LEFT ANTI JOIN hot_users t2 ON t1.user_id = t2.user_id WHERE t1.dt BETWEEN date_sub('${bizdate_1}', 29) AND '${bizdate_1}' AND t1.effective_play_cnt_1d > 0 GROUP BY t1.user_id, t1.song_id HAVING SUM(t1.effective_play_cnt_1d) > 2 -- 30天播放超过2次 ), hot_user_30d_salted AS ( SELECT CASE WHEN t2.record_count > 10000 THEN CONCAT(t1.user_id, '', CAST(RAND() * 50 AS INT)) WHEN t2.record_count > 5000 THEN CONCAT(t1.user_id, '', CAST(RAND() * 30 AS INT)) ELSE CONCAT(t1.user_id, '_', CAST(RAND() * 20 AS INT)) END as user_id_salt, t1.user_id, t1.song_id, t1.song_name, t1.singer_artist_id_list, t1.singer_artist_name_list, t1.genre_tag_name, t1.norm_language, t1.duration, t1.effective_play_cnt_1d FROM music_most.user_song_daily_with_side_info t1 INNER JOIN hot_users t2 ON t1.user_id = t2.user_id WHERE t1.dt BETWEEN date_sub('${bizdate_1}', 29) AND '${bizdate_1}' AND t1.effective_play_cnt_1d > 0 ), hot_user_30d_stage1 AS ( SELECT user_id_salt, user_id, song_id, MAX(song_name) as song_name, MAX(singer_artist_id_list) as singer_artist_id_list, MAX(singer_artist_name_list) as singer_artist_name_list, MAX(genre_tag_name) as genre_tag_name, MAX(norm_language) as norm_language, MAX(duration) as duration, SUM(effective_play_cnt_1d) as partial_play_count FROM hot_user_30d_salted GROUP BY user_id_salt, user_id, song_id ), hot_user_30d AS ( SELECT user_id, song_id, MAX(song_name) as song_name, MAX(singer_artist_id_list) as singer_artist_id_list, MAX(singer_artist_name_list) as singer_artist_name_list, MAX(genre_tag_name) as genre_tag_name, MAX(norm_language) as norm_language, MAX(duration) as duration, SUM(partial_play_count) as play_count FROM hot_user_30d_stage1 GROUP BY user_id, song_id HAVING SUM(partial_play_count) > 2 ), user_song_30d AS ( SELECT * FROM normal_user_30d UNION ALL SELECT * FROM hot_user_30d ), user_song_30d_ranked AS ( SELECT user_id, song_id, play_count, song_name, singer_artist_id_list, singer_artist_name_list, genre_tag_name, norm_language, duration, ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY play_count DESC, song_id) as rank FROM user_song_30d ), user_song_30d_agg AS ( SELECT user_id, collect_list(CASE WHEN rank <= 100 THEN song_id END) as user_often_listen_song_id_list_30d, collect_list(CASE WHEN rank <= 100 THEN song_name END) as user_often_listen_song_name_list_30d, collect_list(CASE WHEN rank <= 100 THEN singer_artist_id_list END) as user_often_listen_artist_id_list_30d, collect_list(CASE WHEN rank <= 100 THEN singer_artist_name_list END) as user_often_listen_artist_name_list_30d, collect_list(CASE WHEN rank <= 100 THEN genre_tag_name END) as user_often_listen_genre_list_30d, collect_list(CASE WHEN rank <= 100 THEN norm_language END) as user_often_listen_language_list_30d, collect_list(CASE WHEN rank <= 100 THEN play_count END) as user_often_listen_play_cnt_list_30d, collect_list(CASE WHEN rank <= 100 THEN duration END) as user_often_listen_duration_list_30d, SUM(CASE WHEN rank <= 100 THEN play_count ELSE 0 END) as total_play_count_30d, COUNT(DISTINCT CASE WHEN rank <= 100 THEN song_id END) as distinct_song_count_30d FROM user_song_30d_ranked WHERE rank <= 100 GROUP BY user_id ), -- ========== 步骤4: 处理90天窗口（复用相同逻辑） ========== -- normal_user_90d AS ( SELECT t1.user_id, t1.song_id, MAX(t1.song_name) as song_name, MAX(t1.singer_artist_id_list) as singer_artist_id_list, MAX(t1.singer_artist_name_list) as singer_artist_name_list, MAX(t1.genre_tag_name) as genre_tag_name, MAX(t1.norm_language) as norm_language, MAX(t1.duration) as duration, SUM(t1.effective_play_cnt_1d) as play_count FROM music_most.user_song_daily_with_side_info t1 LEFT ANTI JOIN hot_users t2 ON t1.user_id = t2.user_id WHERE t1.dt BETWEEN date_sub('${bizdate_1}', 89) AND '${bizdate_1}' AND t1.effective_play_cnt_1d > 0 GROUP BY t1.user_id, t1.song_id HAVING SUM(t1.effective_play_cnt_1d) > 3 -- 90天播放超过3次 ), hot_user_90d_salted AS ( SELECT CASE WHEN t2.record_count > 10000 THEN CONCAT(t1.user_id, '', CAST(RAND() * 50 AS INT)) WHEN t2.record_count > 5000 THEN CONCAT(t1.user_id, '', CAST(RAND() * 30 AS INT)) ELSE CONCAT(t1.user_id, '_', CAST(RAND() * 20 AS INT)) END as user_id_salt, t1.user_id, t1.song_id, t1.song_name, t1.singer_artist_id_list, t1.singer_artist_name_list, t1.genre_tag_name, t1.norm_language, t1.duration, t1.effective_play_cnt_1d FROM music_most.user_song_daily_with_side_info t1 INNER JOIN hot_users t2 ON t1.user_id = t2.user_id WHERE t1.dt BETWEEN date_sub('${bizdate_1}', 89) AND '${bizdate_1}' AND t1.effective_play_cnt_1d > 0 ), hot_user_90d_stage1 AS ( SELECT user_id_salt, user_id, song_id, MAX(song_name) as song_name, MAX(singer_artist_id_list) as singer_artist_id_list, MAX(singer_artist_name_list) as singer_artist_name_list, MAX(genre_tag_name) as genre_tag_name, MAX(norm_language) as norm_language, MAX(duration) as duration, SUM(effective_play_cnt_1d) as partial_play_count FROM hot_user_90d_salted GROUP BY user_id_salt, user_id, song_id ), hot_user_90d AS ( SELECT user_id, song_id, MAX(song_name) as song_name, MAX(singer_artist_id_list) as singer_artist_id_list, MAX(singer_artist_name_list) as singer_artist_name_list, MAX(genre_tag_name) as genre_tag_name, MAX(norm_language) as norm_language, MAX(duration) as duration, SUM(partial_play_count) as play_count FROM hot_user_90d_stage1 GROUP BY user_id, song_id HAVING SUM(partial_play_count) > 3 ), user_song_90d AS ( SELECT * FROM normal_user_90d UNION ALL SELECT * FROM hot_user_90d ), user_song_90d_ranked AS ( SELECT user_id, song_id, play_count, song_name, singer_artist_id_list, singer_artist_name_list, genre_tag_name, norm_language, duration, ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY play_count DESC, song_id) as rank FROM user_song_90d ), user_song_90d_agg AS ( SELECT user_id, collect_list(CASE WHEN rank <= 100 THEN song_id END) as user_often_listen_song_id_list_90d, collect_list(CASE WHEN rank <= 100 THEN song_name END) as user_often_listen_song_name_list_90d, collect_list(CASE WHEN rank <= 100 THEN singer_artist_id_list END) as user_often_listen_artist_id_list_90d, collect_list(CASE WHEN rank <= 100 THEN singer_artist_name_list END) as user_often_listen_artist_name_list_90d, collect_list(CASE WHEN rank <= 100 THEN genre_tag_name END) as user_often_listen_genre_list_90d, collect_list(CASE WHEN rank <= 100 THEN norm_language END) as user_often_listen_language_list_90d, collect_list(CASE WHEN rank <= 100 THEN play_count END) as user_often_listen_play_cnt_list_90d, collect_list(CASE WHEN rank <= 100 THEN duration END) as user_often_listen_duration_list_90d, SUM(CASE WHEN rank <= 100 THEN play_count ELSE 0 END) as total_play_count_90d, COUNT(DISTINCT CASE WHEN rank <= 100 THEN song_id END) as distinct_song_count_90d FROM user_song_90d_ranked WHERE rank <= 100 GROUP BY user_id ) -- ========== 最终结果合并 ========== -- SELECT COALESCE(s7.user_id, s30.user_id, s90.user_id) as user_id, -- 7天窗口 s7.user_often_listen_song_id_list_7d, s7.user_often_listen_song_name_list_7d, s7.user_often_listen_artist_id_list_7d, s7.user_often_listen_artist_name_list_7d, s7.user_often_listen_genre_list_7d, s7.user_often_listen_language_list_7d, s7.user_often_listen_play_cnt_list_7d, s7.user_often_listen_duration_list_7d, -- 30天窗口 s30.user_often_listen_song_id_list_30d, s30.user_often_listen_song_name_list_30d, s30.user_often_listen_artist_id_list_30d, s30.user_often_listen_artist_name_list_30d, s30.user_often_listen_genre_list_30d, s30.user_often_listen_language_list_30d, s30.user_often_listen_play_cnt_list_30d, s30.user_often_listen_duration_list_30d, -- 90天窗口 s90.user_often_listen_song_id_list_90d, s90.user_often_listen_song_name_list_90d, s90.user_often_listen_artist_id_list_90d, s90.user_often_listen_artist_name_list_90d, s90.user_often_listen_genre_list_90d, s90.user_often_listen_language_list_90d, s90.user_often_listen_play_cnt_list_90d, s90.user_often_listen_duration_list_90d, -- 统计信息 COALESCE(s7.total_play_count_7d, 0) as total_play_count_7d, COALESCE(s30.total_play_count_30d, 0) as total_play_count_30d, COALESCE(s90.total_play_count_90d, 0) as total_play_count_90d, COALESCE(s7.distinct_song_count_7d, 0) as distinct_song_count_7d, COALESCE(s30.distinct_song_count_30d, 0) as distinct_song_count_30d, COALESCE(s90.distinct_song_count_90d, 0) as distinct_song_count_90d, current_timestamp() as update_time FROM user_song_7d_agg s7 FULL OUTER JOIN user_song_30d_agg s30 ON s7.user_id = s30.user_id FULL OUTER JOIN user_song_90d_agg s90 ON COALESCE(s7.user_id, s30.user_id) = s90.user_id WHERE COALESCE(s7.user_id, s30.user_id, s90.user_id) IS NOT NULL; 🤖 错误内容通用异常，Spark任务执行失败，错误信息为： java.lang.Exception: process exitCode: 1 该错误信息为Spark任务执行失败的通用异常，未包含具体的SQL语法或逻辑错误提示。根据提供的信息，无法定位具体的SQL错误原因。建议检查Spark执行环境配置、资源分配及运行日志以获取详细错误信息。错误原因：无具体语法或逻辑错误提示，任务执行失败可能由环境配置或资源分配问题引起。修正建议：无SQL语法错误，暂不修改SQL。看下解析有没有问题