1. 数据去重:
-
首先创建一张和原表结构相同的空表。
-
查询原表中不重复的数据,全部插入到新表,删除原表,将新表的名字改为原表名字。
create table yyy like xxx; // 创建一张和xxx表结构相同的空表yyy。
select distinct * from xxx; // 查到原表中所有不重复数据。
insert into yyy select distinct * from xxx; // 将不重复数据全部插入到新表。
rename table xxx to old_xxx,yyy to xxx; // 将原表备份,将新表重命名为原表。
1. 聚合函数:
2. 返回查询数量:
select count(*) from xxx; //查询表中数据数量,可以使用as重命名
select count(distinct math) from xxx; // 查询xxx表中数学成绩不重复的数量
3. 返回数据总和:
select sum(math) from xxx; // 查询表中数学的成绩总和
select sum(math)/count(*) from xxx; // 查询表中数学的平均成绩
1. 分组查询(group by):
-
select 字段1,字段2 from table group by 字段;
-
分组的目的在于后续的聚合统计。
-
分组就是将一组数据按照某个字段分为组后再分组。
select deptno,max(sal) 最高,avg(sal) 平均 from xxx group by deptno; // 显示每个部门的最高和平均薪资
select deptno,job,avg(sal) 平均,min(sal) 最低 from xxx group by deptno,job;
//显示每个部门每个岗位的平均和最低薪资,先按照部门分一次,再按照岗位分一次。
-
在select后面出现的字段只能是group by后出现的,或者是聚合函数。
2. having过滤:
-
having类似于where,作用是过滤group by之后的分组结果,作用于聚合函数。
-
having之后不支持使用别名进行判断筛选。
select deptno,avg(sal) 平均 from xxx group by deptno having avg(sal)<2000;
//显示平均工资低于2000的部门和他的平均薪资
1. 关键字执行顺序:
-
SQL查询中各个关键字的执行先后顺序 from > on> join > where > group by > with > having > select > distinct > order by > limit