Hive行列转换四象限法则:字节面试官的降维打击题
作为数据工程师,行列转换就像玩魔方——不同面需要不同的旋转技巧。我们根据转换维度拆解四大类型,每个类型都附赠字节真题解法!
一、行转多列(1:N横向扩展)
特征:单行记录拆分为多列(典型Pivot操作)
真题示例:用户行为事件统计
输入表 user_events:
user_id | event_time | event_type
1001 | 2023-01-01 08:00 | login
1001 | 2023-01-01 09:30 | purchase
1002 | 2023-01-01 10:15 | view
输出要求:
user_id | first_event | last_event | event_count
1001 | login | purchase | 2
1002 | view | view | 1
解法1:窗口函数组合拳
SELECT
user_id,
MAX(CASE WHEN rn_asc = 1 THEN event_type END) AS first_event,
MAX(CASE WHEN rn_desc = 1 THEN event_type END) AS last_event,
COUNT(*) AS event_count
FROM (
SELECT
user_id, event_type,
ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY event_time) AS rn_asc,
ROW_NUMBER() OVER

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



