表: Employee
+--------------+---------+ | 列名 | 类型 | +--------------+---------+ | id | int | | name | varchar | | salary | int | | departmentId | int | +--------------+---------+ 在 SQL 中,id是此表的主键。 departmentId 是 Department 表中 id 的外键(在 Pandas 中称为 join key)。 此表的每一行都表示员工的 id、姓名和工资。它还包含他们所在部门的 id。
表: Department
+-------------+---------+ | 列名 | 类型 | +-------------+---------+ | id | int | | name | varchar | +-------------+---------+ 在 SQL 中,id 是此表的主键列。 此表的每一行都表示一个部门的 id 及其名称。
查找出每个部门中薪资最高的员工。
按 任意顺序 返回结果表。
查询结果格式如下例所示。
示例 1:
输入: Employee 表: +----+-------+--------+--------------+ | id | name | salary | departmentId | +----+-------+--------+--------------+ | 1 | Joe | 70000 | 1 | | 2 | Jim | 90000 | 1 | | 3 | Henry | 80000 | 2 | | 4 | Sam | 60000 | 2 | | 5 | Max | 90000 | 1 | +----+-------+--------+--------------+ Department 表: +----+-------+ | id | name | +----+-------+ | 1 | IT | | 2 | Sales | +----+-------+ 输出: +------------+----------+--------+ | Department | Employee | Salary | +------------+----------+--------+ | IT | Jim | 90000 | | Sales | Henry | 80000 | | IT | Max | 90000 | +------------+----------+--------+ 解释:Max 和 Jim 在 IT 部门的工资都是最高的,Henry 在销售部的工资最高。
思路:先表关联,再通过部门分组并按照salary排序,取组内排序第一,就是工资最高的。注意同样的金额我们要排名相同才可以,他们两个都是工资最高的。
代码:
SELECT
DEPARTMENT,
EMPLOYEE,
SALARY
FROM (
SELECT
T2.NAME AS DEPARTMENT,
T1.NAME AS EMPLOYEE,
T1.SALARY,
DENSE_RANK() OVER(
PARTITION BY T2.NAME
ORDER BY T1.SALARY DESC
) AS RANKED
FROM EMPLOYEE T1
JOIN DEPARTMENT T2
ON T1.DEPARTMENTID = T2.ID
) AS RANKED_DATA
WHERE RANKED = 1
用DENSE_RANK()而不是row_number,不要命名为rank,会出错,思路想清楚,用关联后的临时表再去分组排序。
628

被折叠的 条评论
为什么被折叠?



