练习题目来自牛客网sq在线编程 非技术快速入门分组计算练习题_牛客题霸_牛客网 (nowcoder.com)
测试用例
create database nk_test; //创建数据库
use nk_test; //进入数据库
-- 创建测试表
drop table if exists user_profile;
CREATE TABLE `user_profile` (
`id` int,
`device_id` int,
`gender` STRING,
`age` int ,
`university` STRING,
`gpa` float,
`active_days_within_30` float,
`question_cnt` float,
`answer_cnt` float
);
-- 向测试表中插入数据
INSERT INTO user_profile VALUES(1,2138,'male',21,'北京大学',3.4,7,2,12);
INSERT INTO user_profile VALUES(2,3214,'male',null,'复旦大学',4.0,15,5,25);
INSERT INTO user_profile VALUES(3,6543,'female',20,'北京大学',3.2,12,3,30);
INSERT INTO user_profile VALUES(4,2315,'female',23,'浙江大学',3.6,5,1,2);
INSERT INTO user_profile VALUES(5,5432,'male',25,'山东大学',3.8,20,15,70);
INSERT INTO user_profile VALUES(6,2131,'male',28,'山东大学',3.3,15,7,13);
INSERT INTO user_profile VALUES(7,4321,'male',28,'复旦大学',3.6,9,6,52);
描述
题目:现在运营想要对每个学校不同性别的用户活跃情况和发帖数量进行分析,请分别计算出每个学校每种性别的用户数、30天内平均活跃天数和平均发帖数量。
用户信息表:user_profile
30天内活跃天数字段(active_days_within_30)
发帖数量字段(question_cnt)
回答数量字段(answer_cnt)
id | device_id | gender | age | university | gpa | active_days_within_30 | question_cnt | answer_cnt |
---|---|---|---|---|---|---|---|---|
1 | 2138 | male | 21 | 北京大学 | 3.4 | 7 | 2 | 12 |
2 | 3214 | male | 复旦大学 | 4.0 | 15 | 5 | 25 | |
3 | 6543 | female | 20 | 北京大学 | 3.2 | 12 | 3 | 30 |
4 | 2315 | female | 23 | 浙江大学 | 3.6 | 5 | 1 | 2 |
5 | 5432 | male | 25 | 山东大学 | 3.8 | 20 | 15 | 70 |
6 | 2131 | male | 28 | 山东大学 | 3.3 | 15 | 7 | 13 |
7 | 4321 | male | 26 | 复旦大学 | 3.6 | 9 | 6 | 52 |
第一行表示:id为1的用户的常用信息为使用的设备id为2138,性别为男,年龄21岁,北京大学,gpa为3.4在过去的30天里面活跃了7天,发帖数量为2,回答数量为12
。。。
最后一行表示:id为7的用户的常用信息为使用的设备id为4321,性别为男,年龄26岁,复旦大学,gpa为3.6在过去的30天里面活跃了9天,发帖数量为6,回答数量为52
你的查询返回结果需要对性别和学校分组,示例如下,结果保留1位小数,1位小数之后的四舍五入:
gender | university | user_num | avg_active_day | avg_question_cnt |
---|---|---|---|---|
male | 北京大学 | 1 | 7.0 | 2.0 |
male | 复旦大学 | 2 | 12.0 | 5.5 |
female | 北京大学 | 1 | 12.0 | 3.0 |
female | 浙江大学 | 1 | 5.0 | 1.0 |
male | 山东大学 | 2 | 17.5 | 11.0 |
解决方案
SELECT
gender,university,
COUNT(gender) as user_num,
AVG(active_days_within_30) as avg_active_day,
AVG(question_cnt) as avg_question_cnt
FROM user_profile
GROUP BY university,gender
方案分析
题目要求对每个学校不同性别的用户活跃情况和发帖数量进行分析,请分别计算出每个学校每种性别的用户数、30天内平均活跃天数和平均发帖数量。
当看见每个学校不同性别这里,就应想到要先对学校进行分组,再对性别进行分组,这样就将不同学校不同性别的人聚在了一起。
计算人数使用 count计数,30天内的平均活跃天数只需要要对30天内的活跃天数字段取平均值(avg)即可,
平均发帖数也只需对发帖数量字段求取平均值即可(avg)。
计算人数使用 count计数,30天内的平均活跃天数只需要要对30天内的活跃天数字段取平均值(avg)即可,
平均发帖数也只需对发帖数量字段求取平均值即可(avg)。