每日一道SQL题(二)

博客围绕 SQL 中更新 salary 表值的问题展开,要求交换 m 和 f 值,且只用一个 Update 语句、无临时表。介绍了三种解题思路,包括 case when 语句、if 语句,以及针对单字符值的 char + ascii 组合,总结了不同场景适用的方法。

一、627. 变更性别

给定一个 salary 表,如下所示,有 m = 男性 和 f = 女性 的值。交换所有的 f 和 m 值(例如,将所有 f 值更改为 m,反之亦然)。要求只使用一个更新(Update)语句,并且没有中间的临时表。
注意,您必只能写一个 Update 语句,请不要编写任何 Select 语句。

例如:

idnamesexsalary
1Am2500
2Bf1500
3Cm5500
4Df500

运行你所编写的更新语句之后,将会得到以下表:

idnamesexsalary
1Af2500
2Bm1500
3Cf5500
4Dm500

二、解题思路

1.case when 语句

代码如下(示例):

update salary set sex = (
	case sex
	when 'm' then 'f'
	else 'm'
	end
);

2.if 语句

代码如下(示例):

update salary set sex = if(sex = 'm', 'f', 'm');

3. char + ascii

对于值为单个字符的可以使用char + ascii组合来进行值的调换
代码如下(示例):

update salary 
set sex = char(ascii('m') + ascin('f') - ascii(sex));

总结

对于update表中的某个值有特殊要求的时候,就可以考虑case when或者if语句。当字段值为单个字符的时候还可以考虑ascii码。

### PDD Hive SQL 面试解析 #### 1. 用户行为分析 在拼多多(PDD)的数据分析场景中,用户的行为数据通常存储于大规模分布式数据库中。Hive 是一种常用的大规模数据分析工具,在处理用户行为日志时非常高效。 以下是常见的用户行为分析目: - **问描述**: 统计某一天内用户的点击次数,并按用户 ID 排序。 ```sql SELECT user_id, COUNT(*) AS click_count FROM user_clicks WHERE date = '2023-10-01' GROUP BY user_id ORDER BY click_count DESC; ``` 此查询通过 `COUNT` 函数统计每个用户的点击次数,并利用 `GROUP BY` 和 `ORDER BY` 对结果进行分组和排序[^5]。 --- #### 2. 销售数据汇总 对于电商平台而言,销售数据的汇总是一个核心需求。以下是一道经典的销售数据汇总目: - **问描述**: 计算每日商品销售额,并找出销售额最高的前五天的商品及其对应的销售额。 ```sql WITH daily_sales AS ( SELECT product_id, sale_date, SUM(sale_amount) AS total_sales FROM sales_table GROUP BY product_id, sale_date ) SELECT product_id, sale_date, total_sales FROM daily_sales ORDER BY total_sales DESC LIMIT 5; ``` 这段代码首先通过子查询计算每一天每件商品的总销售额,再从中选出销售额最高的前五个记录[^6]。 --- #### 3. 去重与清洗 在实际生产环境中,原始数据可能存在重复项或其他质量问。因此,掌握如何清理和去重是非常重要的技能。 - **问描述**: 删除中所有重复的记录,仅保留一条最新的记录。 假设有一张订单 `orders`,其中包含字段 `order_id`, `user_id`, `create_time`,可以通过如下方式实现去重: ```sql DELETE FROM orders o1 USING orders o2 WHERE o1.user_id = o2.user_id AND o1.create_time < o2.create_time; ``` 该语句基于 `user_id` 进行匹配,删除较早创建时间的重复记录[^7]。 --- #### 4. 时间窗口函数应用 时间序列分析是电商领域的重要部分之一,尤其是在涉及交易历史或用户活动轨迹的情况下。 - **问描述**: 找出每位用户最近的一笔有效订单。 可以借助 Hive 的窗口函数来解决这一问: ```sql SELECT * FROM ( SELECT *, ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY order_time DESC) AS rn FROM orders WHERE is_valid = 1 ) t WHERE rn = 1; ``` 在此查询中,`ROW_NUMBER()` 结合分区条件 (`PARTITION BY`) 和排序条件 (`ORDER BY`) 实现了对每一位用户的最新有效订单筛选[^8]。 --- #### 5. 复杂聚合运算 某些情况下,需要针对特定维度执行复杂的聚合操作。例如,统计车辆在不同驾驶模式下累计的时间占比。 - **问描述**: 按照车架号(VIN),计算每种驱动模式所占的比例。 ```sql WITH mode_summary AS ( SELECT vin, power_mode, SUM(total_seconds) AS seconds_sum, SUM(SUM(total_seconds)) OVER (PARTITION BY vin) AS total_seconds_per_vin FROM driving_data GROUP BY vin, power_mode ) SELECT vin, power_mode, ROUND(seconds_sum / total_seconds_per_vin * 100, 2) AS percentage FROM mode_summary; ``` 以上代码片段展示了如何使用窗口函数完成比例计算的任务[^9]。 --- ### 总结 上述内容涵盖了多个典型的 Hive SQL 面试考点,包括但不限于用户行为分析、销售数据汇总、数据清洗以及复杂聚合运算等主。这些知识点不仅适用于拼多多这样的电商业务场景,也广泛应用于其他行业的大数据分析工作中。 ---
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值