每日一道SQL题(四)

博客围绕SQL查询 Employee 表中第二高的薪水展开,介绍了两种解题思路,一是使用 limit + offset 并处理 null 值,二是通用写法。还总结了 limit 及 limit+offset 的用法,如 limit y 读 y 条数据等。

一、176. 第二高的薪水

编写一个 SQL 查询,获取 Employee 表中第二高的薪水(Salary) 。

IdSalary
1100
2200
3300

例如上述 Employee 表,SQL查询应该返回 200 作为第二高的薪水。如果不存在第二高的薪水,那么查询应返回 null。

SecondHighestSalary
200

题目连接

二、解题思路

1.limit + offset

代码如下(示例):

select 
distinct salary as SecondHighestSalary
from employee
limit 1 offset 1

题目要求:如果不存在第二高的薪水,那么查询应返回 null。那么上述SQL是不满足条件的,还需对null值进行处理

  • 临时表
select
(select 
distinct salary
from employee
limit 1 offset 1) as SecondHighestSalary
  • 函数ifnull
select
IFNULL(
(select 
distinct salary
from employee
limit 1 offset 1),null) as SecondHighestSalary

2.通用写法

代码如下(示例):

select
max(salary)
from employee
where salary < (
	select max(salary) 
	from employee)

总结

limit以及limit+offset用法

  • limit y 分句表示: 读取 y 条数据
  • limit x, y 分句表示: 跳过 x 条数据,读取 y 条数据
  • limit y offset x 分句表示: 跳过 x 条数据,读取 y 条数据
### PDD Hive SQL 面试解析 #### 1. 用户行为分析 在拼多多(PDD)的数据分析场景中,用户的行为数据通常存储于大规模分布式数据库中。Hive 是一种常用的大规模数据分析工具,在处理用户行为日志时非常高效。 以下是常见的用户行为分析目: - **问描述**: 统计某一天内用户的点击次数,并按用户 ID 排序。 ```sql SELECT user_id, COUNT(*) AS click_count FROM user_clicks WHERE date = '2023-10-01' GROUP BY user_id ORDER BY click_count DESC; ``` 此查询通过 `COUNT` 函数统计每个用户的点击次数,并利用 `GROUP BY` 和 `ORDER BY` 对结果进行分组和排序[^5]。 --- #### 2. 销售数据汇总 对于电商平台而言,销售数据的汇总是一个核心需求。以下是一道经典的销售数据汇总目: - **问描述**: 计算每日商品销售额,并找出销售额最高的前五天的商品及其对应的销售额。 ```sql WITH daily_sales AS ( SELECT product_id, sale_date, SUM(sale_amount) AS total_sales FROM sales_table GROUP BY product_id, sale_date ) SELECT product_id, sale_date, total_sales FROM daily_sales ORDER BY total_sales DESC LIMIT 5; ``` 这段代码首先通过子查询计算每一天每件商品的总销售额,再从中选出销售额最高的前五个记录[^6]。 --- #### 3. 去重与清洗 在实际生产环境中,原始数据可能存在重复项或其他质量问。因此,掌握如何清理和去重是非常重要的技能。 - **问描述**: 删除表中所有重复的记录,仅保留一条最新的记录。 假设有一张订单表 `orders`,其中包含字段 `order_id`, `user_id`, `create_time`,可以通过如下方式实现去重: ```sql DELETE FROM orders o1 USING orders o2 WHERE o1.user_id = o2.user_id AND o1.create_time < o2.create_time; ``` 该语句基于 `user_id` 进行匹配,删除较早创建时间的重复记录[^7]。 --- #### 4. 时间窗口函数应用 时间序列分析是电商领域的重要部分之一,尤其是在涉及交易历史或用户活动轨迹的情况下。 - **问描述**: 找出每位用户最近的一笔有效订单。 可以借助 Hive 的窗口函数来解决这一问: ```sql SELECT * FROM ( SELECT *, ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY order_time DESC) AS rn FROM orders WHERE is_valid = 1 ) t WHERE rn = 1; ``` 在此查询中,`ROW_NUMBER()` 结合分区条件 (`PARTITION BY`) 和排序条件 (`ORDER BY`) 实现了对每一位用户的最新有效订单筛选[^8]。 --- #### 5. 复杂聚合运算 某些情况下,需要针对特定维度执行复杂的聚合操作。例如,统计车辆在同驾驶模式下累计的时间占比。 - **问描述**: 按照车架号(VIN),计算每种驱动模式所占的比例。 ```sql WITH mode_summary AS ( SELECT vin, power_mode, SUM(total_seconds) AS seconds_sum, SUM(SUM(total_seconds)) OVER (PARTITION BY vin) AS total_seconds_per_vin FROM driving_data GROUP BY vin, power_mode ) SELECT vin, power_mode, ROUND(seconds_sum / total_seconds_per_vin * 100, 2) AS percentage FROM mode_summary; ``` 以上代码片段展示了如何使用窗口函数完成比例计算的任务[^9]。 --- ### 总结 上述内容涵盖了多个典型的 Hive SQL 面试考点,包括但限于用户行为分析、销售数据汇总、数据清洗以及复杂聚合运算等主。这些知识点仅适用于拼多多这样的电商业务场景,也广泛应用于其他行业的大数据分析工作中。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值