一、数据
RequestAccepted
表:
+----------------+---------+ | Column Name | Type | +----------------+---------+ | requester_id | int | | accepter_id | int | | accept_date | date | +----------------+---------+ (requester_id, accepter_id) 是这张表的主键(具有唯一值的列的组合)。 这张表包含发送好友请求的人的 ID ,接收好友请求的人的 ID ,以及好友请求通过的日期。
编写解决方案,找出拥有最多的好友的人和他拥有的好友数目。
生成的测试用例保证拥有最多好友数目的只有 1 个人。
查询结果格式如下例所示。
示例 1:
输入: RequestAccepted 表: +--------------+-------------+-------------+ | requester_id | accepter_id | accept_date | +--------------+-------------+-------------+ | 1 | 2 | 2016/06/03 | | 1 | 3 | 2016/06/08 | | 2 | 3 | 2016/06/08 | | 3 | 4 | 2016/06/09 | +--------------+-------------+-------------+ 输出: +----+-----+ | id | num | +----+-----+ | 3 | 3 | +----+-----+ 解释: 编号为 3 的人是编号为 1 ,2 和 4 的人的好友,所以他总共有 3 个好友,比其他人都多。
二、分析
由题可知,我们需要计算出每个人的朋友数量,因此,我们可以对每个人的id进行分组,求出count。
注意:在这张表中,requester_id的朋友是accepter_id,同时accepter_id的朋友也是requester_id。
所以我们第一个查询需要查出所有的requester_id(包括重复项,每一个重复项代表一个朋友);
同理,第二个查询需要查出所有的accepter_id(包括重复项,每一个重复项代表一个朋友);
然后用UNION ALL将两个查询联合起来,然后在对联合后的id进行分组求和,最后求出有最多朋友的人物id。
三、代码
1、求出所有出现的id。
SELECT requester_id
FROM requestaccepted
UNION ALL --使用UNION ALL函数联合两个查询
SELECT accepter_id
FROM requestaccepted;
2、对每个出现的id进行分组计数,进而求出答案。
SELECT requester_id id,
COUNT(1) num
FROM (SELECT requester_id
FROM requestaccepted
UNION ALL
SELECT accepter_id
FROM requestaccepted) t
GROUP BY requester_id
ORDER BY num DESC -- 对出现的次数进行排序
LIMIT 1; -- 仅返回num为最大的id
· 进阶:
在真实世界里,可能会有多个人拥有好友数相同且最多,你能找到所有这些人吗?
当有多个人拥有好友数量相同且最多时,以上代码就不能解决,因此,最简单的办法就是在原本查询的基础上再加一列,即:最大的出现次数,然后再套一层子查询,让num等于这个最大的num值即可。
SELECT id, num
FROM (
SELECT requester_id AS id,
COUNT(1) AS num,
MAX(COUNT(1)) OVER () AS mv -- 用窗口函数最大的好友数量
FROM (
SELECT requester_id
FROM requestaccepted
UNION ALL
SELECT accepter_id
FROM requestaccepted
) t
GROUP BY requester_id
) subquery
WHERE num = mv; -- num等于最大的好友数量
四、小结
本题主要使用了子查询的相关知识解决问题。
在·进阶·中,我们使用了窗口函数,当一条查询语句中没有GROUP BY分组,且SELECT后有普通字段的,不能直接使用聚合函数,因此需要搭配窗口函数使用。
注意:UNION ALL 和 UNION的区别在于UNION会将两条查询语句的结果总体去重,而UNION ALL会保持原样输出,如若使用UNION进行合并,那么每个人的ID仅仅只出现一次,不符合题目的要求,因此使用UNION ALL。