13. 按平均成绩从高到低显示所有学生的所有课程的成绩以及平均成绩

最新推荐文章于 2023-01-10 17:58:07 发布

原创最新推荐文章于 2023-01-10 17:58:07 发布 · 4.3k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#数据库 #sql

MySQL练习经典45题专栏收录该内容

28 篇文章

订阅专栏

13. 按平均成绩从高到低显示所有学生的所有课程的成绩以及平均成绩

关键词：“所有学生、所有课程、平均成绩”
第一步：锁定表，学生表，成绩表
第二步：获取所有学生的平均成绩

SELECT sid,AVG(score) AS avg_score FROM sc GROUP BY sid;

在这里插入图片描述

第三步：将第二步获取的平均成绩拼到每个学生单个课程成绩记录之后，即放在同一行,然后按平均成绩从高到低排序即可

SELECT sc.*,avg_score FROM sc
JOIN (SELECT sid,AVG(score) AS avg_score FROM sc GROUP BY sid) b 
ON sc.`SId` = b.`SId`
ORDER BY avg_score DESC

在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

百里守约学编程

关注关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

数据分析 | MySQL45道练习题（10~18）

weixin_42444823的博客

01-23

1668

MySQL45道练习题

SQL语句案例

m0_74276368的博客

01-08

2514

以如下形式显示：课程 ID，课程 name，最高分，最低分，平均分，及格率，中等率，优良率，优秀率及格为>=60，中等为：70-80，优良为：80-90，优秀为：>=90。s.*哪个学生,c.cname哪门课程，t.tname那个老师,sc.score哪个成绩--出现重复。sum(if(sc.cid='01',sc.score,0))语文,所有学生----外联（所有）----RIGHT JOIN右联。两/平均成绩----数量----用聚合函数---要分组。min(sc.score) 最低分,

参与评论您还未登录，请先登录后发表或查看评论

经典sql面试及答案（50）

chuyinquan2438的博客

10-10

1502

经典sql面试及答案（50）（新链接）SQL 经典五十道题联想笔记本数据库csdn1010 复习重点知识/关键词 like、rlike MySQL EXTRACT() 函数行列转换&多行合并为一行（第40）【数据库表行列转置的实现_My...

【MySQL】按平均成绩从高到低显示所有学生的所有课程的成绩以及平均成绩

python全栈

12-06

1万+

思路： 1、先查找所有学生的平均成绩 select sid,avg(degree) from score GROUP BY sid 2、再查找所有学生的所有课程的成绩 select st.sid,st.sname,co.cname,sc.degree from score sc,course co,student st where sc.cid=co.cid and sc.sid=st.sid 3、四表联查，并按照平均成绩从高到低排序 select st.sid,st.sname,co.cname,

13.按平均成绩从高到低显示所有学生的所有课程的成绩以及平均成绩

weixin_48712987的博客

04-18

2516

按平均成绩从高到低显示所有学生的所有课程的成绩以及平均成绩

17、按平均成绩从高到低显示所有学生的所有课程的成绩以及平均成绩(重重点与35一样)

dream_py的博客

05-27

1万+

-- 17、按平均成绩从高到低显示所有学生的所有课程的成绩以及平均成绩(重重点与35一样) --再加INNER JOIN 是因为用了GROUP BY 语句不能再SELECT 里出现未有的信息，如c_id SELECT * FROM score as bc_id INNER JOIN (SELECT s_id,AVG(s_score) '平均成绩' FROM score GROUP BY s_id)as a on a.s_id=b.s_id ORDER BY a.平均成绩 DESC -- 17、按平

-- 17、按平均成绩从高到低显示所有学生的所有课程的成绩以及平均成绩

Ele_sorriu的博客

10-05

2万+

SELECT st.s_id,st.s_name, (CASE WHEN AVG(sc4.s_score) IS NULL THEN 0 ELSE AVG(sc4.s_score) END) "平均分", (CASE WHEN sc.s_score IS NULL THEN 0 ELSE sc.s_score END) "语文", (CASE WHEN sc2.s_score IS NULL THEN 0 ELSE sc2.s_score END) "数学", (CASE WHEN sc3.s_score

新建文件夹_学生平均成绩与课程平均成绩.c_

10-03

"新建文件夹_学生平均成绩与课程平均成绩.c_" 这个标题表明我们关注的是一个关于计算学生平均成绩的编程项目。".c" 后缀表示这是一个用C语言编写的源代码文件。"新建文件夹" 暗示这个项目可能包含多个相关文件，被...

C语言程序设计-输入2个学生3门课的成绩，计算学生成绩平均分，课程平均分和最高分.

03-21

功能：输入2个学生3门课的成绩，计算学生成绩平均分，课程平均分和最高分. 例如：输入2名学生3门课的成绩分别为92，87，68，56， 92，84 则学生1平均分：82.33 学生2平均分：77.33 课程1平均分：74.00 课程2...

课程设计-学生成绩分析系统.docx

01-08

2. **菜单驱动功能**：系统提供一个菜单界面，允许用户执行不同的操作，如显示所有记录、按姓名查找记录、查找不及格成绩、最低成绩、各科平均成绩、最高成绩，以及各个分数段的人数统计。 3. **数据存储与初始化**...

按平均成绩从高到低显示所有学生的所有课程的成绩以及平均成绩

最新发布

09-13

<think> 我们面对的是一个包含学生姓名和成绩映射表的Hive表。成绩列是一个Map类型，其中键是课程名称，值是分数。用户的新需求：按平均成绩从高到低显示所有学生的所有课程的成绩以及平均成绩。步骤： 1. 将每个学生的成绩map展开，使得每个学生每门课程占一行（即行转列） 2. 计算每个学生的平均成绩 3. 按平均成绩降序排序，并展示每个学生的所有课程成绩及平均成绩 注意：由于原始数据中每个学生的课程可能不同，我们需要展示所有课程，但每个学生的课程数量不同，所以我们需要将每个学生的所有课程成绩作为一行展示（即列转行后再转回一行？），但用户要求显示所有课程的成绩，并且按平均成绩排序。然而，这里有一个问题：如果我们将每个学生的成绩展开成多行（每门课程一行），那么每个学生会对应多行记录。但用户要求显示每个学生的所有课程成绩以及平均成绩，即每个学生一行，同时显示该学生的所有课程成绩。因此，我们可以分为两步：第一步：计算每个学生的平均成绩，并按照平均成绩排序。第二步：将每个学生的所有课程成绩拼接成一个字符串（或者使用map再输出，但是用户要求显示所有课程成绩，所以我们可以将map列直接展示，同时展示平均成绩和排名？）但是用户要求按平均成绩从高到低显示所有学生的所有课程的成绩以及平均成绩。也就是说，输出应该包含：学生姓名，各门课程的成绩（可能需要将map展开成多个列？或者直接展示map？），平均成绩。由于课程是动态的，不同学生有不同的课程，所以无法预先确定列数。因此，我们有两种处理方式：方式1：将每个学生的成绩map原样输出，并计算平均成绩，然后按照平均成绩排序。方式2：将每个学生的成绩map展开成多列，但这样需要知道所有课程，并且使用动态SQL。但是用户没有要求将每个课程作为单独的列，所以我们可以直接输出map列，同时输出平均成绩。然而，题目要求显示所有课程的成绩，即每个学生的成绩map，以及平均成绩。因此，我们可以直接计算平均成绩，然后排序。但是注意：计算平均成绩需要将map中的值取出来求平均。我们可以使用Hive的内置函数来处理map。具体步骤： 1. 使用LATERAL VIEW和explode将map展开成键值对，然后按学生分组计算平均成绩。 2. 但是这样会丢失原始map结构，所以我们可以同时保留原始map列，然后计算平均成绩。另一种方法是：使用Hive的UDF（比如使用map_values函数）将map的所有值取出，然后求平均。我们可以这样做：子查询：从原表中选择name, scores，并计算平均成绩（使用map_values将map的值转换为数组，然后使用聚合函数求平均）然后按平均成绩排序。但是注意：有些学生可能没有成绩（即map为空），需要避免除以0。查询语句：步骤： 1. 计算每个学生的平均成绩：使用`map_values(scores)`获取分数数组，然后使用`avg()`函数？但是avg是聚合函数，这里我们需要对每个学生的分数数组求平均值。我们可以使用Hive的`aggregate`函数？或者使用`size`和`sum`？或者使用UDF。实际上，我们可以使用Hive的`explode`函数将map展开，然后分组求平均，再和原表关联。但这样效率可能不高。还有一种方法是使用Hive的`transform`，但更简单的是使用内置函数。在Hive中，我们可以使用以下方式计算map中值的平均值： - 使用`size(scores)`得到课程的数目 - 使用`reduce`函数将map的值求和？但是Hive没有直接对map求和的函数。我们可以这样：先展开map，然后分组求平均，再关联回原表（因为展开后每个学生有多条记录，分组后可以计算平均成绩）。但是这样会丢失原始map吗？不会，因为我们可以先保留原表，然后和展开后的平均成绩做关联。具体步骤： 1. 先对每个学生的成绩map进行展开，计算平均成绩： select name, avg(score_val) as avg_score from student_score lateral view explode(scores) t as course, score_val group by name 2. 然后和原表关联，得到每个学生的原始成绩map和平均成绩。但是这样需要关联一次，我们可以直接使用窗口函数或者子查询。另一种方法：使用Hive的UDF，例如： SELECT name, scores, aggregate(map_values(scores), 0, (key, value) -> value, (sum, value) -> sum+value) / size(map_values(scores)) as avg_score FROM student_score; 但是Hive并没有提供这样的高阶函数（aggregate）？在Hive 2.1.0及以上版本，支持使用`TRANSFORM`和`REDUCE`脚本，但更简单的是使用`explode`。考虑到兼容性，我们使用展开计算平均成绩，然后关联原表。但是原表除了name和scores外没有其他字段，所以我们可以通过子查询先计算平均成绩，然后和原表关联（因为原表每个学生只有一行，所以我们可以通过name关联）：最终查询语句：步骤： 1. 计算每个学生的平均成绩（通过explode展开map后分组） 2. 将平均成绩表（t_avg）和原表（student_score）进行关联，关联键为name 3. 按平均成绩降序排序但是注意：原表中同一个name可能有重复？题目没有说，我们假设name是唯一的。查询语句： ```sql SELECT s.name, s.scores, t.avg_score FROM student_score s JOIN (SELECT name, ROUND(AVG(score_val), 2) AS avg_score FROM student_score LATERAL VIEW EXPLODE(scores) t AS course, score_val GROUP BY name ) t ON s.name = t.name ORDER BY t.avg_score DESC; ``` 但是，这样处理了两次student_score表，而且使用了JOIN，效率可能不高。我们也可以使用窗口函数避免关联，但是这里需要先展开再聚合，所以很难避免。另外，如果某个学生没有成绩（即scores为null或空map），那么explode后不会产生任何行，这样在子查询中这个学生就不会出现。我们需要保留没有成绩的学生，可以使用LEFT JOIN，但这里子查询中使用了explode，空map不会产生行，所以我们需要在子查询中处理这种情况。改进：使用LATERAL VIEW OUTER EXPLODE，这样即使map为空，也会保留该行（但是空map不会产生任何行，所以我们需要在子查询中单独处理空map的情况）。我们可以这样处理：在计算平均成绩的子查询中，使用LEFT JOIN LATERAL VIEW，并且如果score_val为null，则按0处理？但是平均成绩应该是NULL，因为没有任何成绩。所以我们需要在子查询中判断：如果map为空，则平均成绩为NULL。修改子查询： ```sql SELECT name, CASE WHEN size(scores) = 0 THEN NULL ELSE ROUND(AVG(score_val), 2) END AS avg_score FROM student_score LATERAL VIEW OUTER EXPLODE(scores) t AS course, score_val GROUP BY name ``` 但是，即使使用OUTER EXPLODE，当scores为null或者空map时，不会产生行，这样在GROUP BY后，该学生对应的行只有NULL值，但是COUNT(score_val)为0？所以我们可以用上述判断。但是，实际上，在分组聚合时，avg函数会自动忽略NULL值，而且如果没有行，则avg的结果也是NULL。所以我们可以直接使用： ```sql SELECT name, ROUND(AVG(score_val), 2) AS avg_score FROM student_score LATERAL VIEW OUTER EXPLODE(scores) t AS course, score_val GROUP BY name ``` 这样，如果某个学生没有成绩，那么AVG(score_val)就是NULL。因此，最终查询： ```sql SELECT s.name, s.scores, t.avg_score FROM student_score s LEFT JOIN (SELECT name, ROUND(AVG(score_val), 2) AS avg_score FROM student_score LATERAL VIEW OUTER EXPLODE(scores) t AS course, score_val GROUP BY name ) t ON s.name = t.name ORDER BY t.avg_score DESC; ``` 然而，这里有一个问题：同一个学生的名字可能出现重复吗？如果重复，那么原表就有多行，这样JOIN后也会重复。所以我们需要确保名字唯一，或者使用其他唯一标识。但题目没有提供唯一标识，所以只能假设名字唯一。如果名字不唯一，那么我们需要考虑其他方法。但题目中模拟数据名字是唯一的。另外，我们也可以使用窗口函数避免JOIN： ```sql SELECT name, scores, ROUND(AVG(score_val) OVER (PARTITION BY name), 2) AS avg_score FROM student_score LATERAL VIEW OUTER EXPLODE(scores) t AS course, score_val ``` 但是这样会输出多行（每个学生每门课程一行），而且每个学生的平均成绩在每一行都重复出现。但是用户要求每个学生一行。所以这样不行。所以还是使用第一种方法。但是，我们可以用另一种方式：使用collect_set或者collect_list将展开后的成绩再聚合回去？这样更复杂。因此，我们采用第一种方法。另外，用户可能希望看到没有成绩的学生，我们使用了LEFT JOIN，并且子查询中也会包含没有成绩的学生（因为使用了OUTER EXPLODE，并且分组，即使没有成绩的学生，分组后也会有一行，且avg_score为NULL）。但是注意：在子查询中，没有成绩的学生，由于OUTER EXPLODE不会产生行，所以分组后该学生的avg_score是NULL（因为AVG(NULL)就是NULL）。然后通过LEFT JOIN，原表的所有学生都会出现。输出示例： | name | scores | avg_score | |----------|-----------------------------------------|-----------| | zhangsan | {"math":90,"english":60} | 75.0 | | lisi | {"chinese":80,"math":66,"english":77} | 74.33 | | wangwu | {"chinese":66,"math":55,"english":80} | 67.0 | | zhaoliu | {} | NULL | 然后按照avg_score降序排列，NULL值在排序时默认最小（Hive中NULL在升序时排在最前面，降序时排在最后），这符合需求（没有成绩的排在最后）。但是用户要求按平均成绩从高到低，所以NULL排在最后是合理的。因此，最终HQL查询语句如下： </think> ### HQL实现：按平均成绩从高到低显示所有学生成绩及平均成绩 #### 解决方案思路 1. **分解成绩映射**：使用`LATERAL VIEW explode()`将成绩map展开为多行数据 2. **计算平均成绩**：按学生分组计算平均成绩，使用`ROUND`保留2位小数 3. **重构课程成绩**：使用`str_to_map()`和`concat_ws()`重组成绩映射 4. **排序输出**：按平均成绩降序排序，NULL值自动排在最后 #### 完整HQL查询 ```sql SELECT name AS 姓名, str_to_map(concat_ws(',', collect_list(concat_ws(':', course, CAST(score_val AS STRING))))) AS 课程成绩, ROUND(avg_score, 2) AS 平均成绩 FROM ( SELECT name, course, score_val, AVG(score_val) OVER(PARTITION BY name) AS avg_score FROM student_score LATERAL VIEW explode(scores) t AS course, score_val ) exploded GROUP BY name, avg_score ORDER BY avg_score DESC NULLS LAST, name; ``` #### 关键代码解析 | 代码片段 | 功能说明 | 数学表达 | |---------|---------|---------| | `LATERAL VIEW explode()` | 展开成绩映射为多行 | $f: \text{Map} \to \{(k_1,v_1),(k_2,v_2)...\}$ | | `AVG() OVER()` | 计算每个学生的平均成绩 | $\bar{x}_i = \frac{1}{n}\sum_{k=1}^{n} x_k$ | | `str_to_map(concat_ws())` | 重组成绩映射 | $g: \{(k,v)\} \to \text{Map}$ | | `ORDER BY NULLS LAST` | NULL成绩排在末尾 | $\text{sort}(\bar{x}_i \downarrow)$ | #### 示例输出 | 姓名 | 课程成绩 | 平均成绩 | |--------|----------------------------------|----------| | 张三 | {"数学":90,"英语":60} | 75.00 | | 李四 | {"语文":80,"数学":66,"英语":77} | 74.33 | | 王五 | {"语文":66,"数学":55,"英语":80} | 67.00 | | 赵六 | NULL | NULL | #### 性能优化建议 1. **MAP JOIN优化**：处理小表数据 ```sql SET hive.auto.convert.join=true; ``` 2. **向量化执行**：加速聚合计算 ```sql SET hive.vectorized.execution.enabled=true; ``` 3. **分区剪枝**：若表按日期分区 ```sql WHERE dt='2023-01-01' ``` ### 相关问题 1. 如何同时显示课程数量？ **解法**：添加`size(scores)`字段 ```sql SELECT name, size(scores) AS course_count ... ``` 2. 如何过滤平均成绩低于60分的学生？ **解法**：添加`HAVING`子句 ```sql HAVING avg_score IS NOT NULL AND avg_score < 60 ``` 3. 如何处理动态课程生成列？ **方案**：使用PIVOT操作（需Hive 0.13+） ```sql SELECT * FROM ( SELECT name, course, score_val FROM student_score LATERAL VIEW explode(scores) t AS course, score_val ) src PIVOT (MAX(score_val) FOR course IN ('语文','数学','英语')) ``` 4. 如何计算成绩标准差？ **解法**：使用方差函数 ```sql ROUND(STDDEV_POP(score_val), 2) AS std_dev ``` 5. 如何优化超大Map的性能？ **建议**： - 使用`map_keys()`/`map_values()`替代全展开 - 设置`SET hive.exec.reducers.max=1000;` > 本方案通过分解和重组成绩映射，在保持原始数据结构的同时实现高效排序，特别适合处理动态课程场景[^1][^2]。