【数据库二】 distinct,连接查询,子查询,union,limit,表的创建,插入,修改,删除,还包括date和datetime

本文详细介绍了数据库查询中的关键概念,包括使用`DISTINCT`去除重复记录、连接查询(内连接、外连接、自连接)、子查询(在`WHERE`和`FROM`子句中的应用)以及`UNION`合并查询结果。此外,还讲解了`LIMIT`用于分页查询的重要性和用法,以及`DQL`语句的总结。通过对各种查询方式的实例解析,帮助读者深入理解数据库操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

把查询结果去除重复记录-distinct

原本结果
mysql> select * from emp;

+-------+--------+-----------+------+------------+---------+---------+--------+
| EMPNO | ENAME  | JOB       | MGR  | HIREDATE   | SAL     | COMM    | DEPTNO |
+-------+--------+-----------+------+------------+---------+---------+--------+
|  7369 | SMITH  | CLERK     | 7902 | 1980-12-17 |  800.00 |    NULL |     20 |
|  7499 | ALLEN  | SALESMAN  | 7698 | 1981-02-20 | 1600.00 |  300.00 |     30 |
|  7521 | WARD   | SALESMAN  | 7698 | 1981-02-22 | 1250.00 |  500.00 |     30 |
|  7566 | JONES  | MANAGER   | 7839 | 1981-04-02 | 2975.00 |    NULL |     20 |
|  7654 | MARTIN | SALESMAN  | 7698 | 1981-09-28 | 1250.00 | 1400.00 |     30 |
|  7698 | BLAKE  | MANAGER   | 7839 | 1981-05-01 | 2850.00 |    NULL |     30 |
|  7782 | CLARK  | MANAGER   | 7839 | 1981-06-09 | 2450.00 |    NULL |     10 |
|  7788 | SCOTT  | ANALYST   | 7566 | 1987-04-19 | 3000.00 |    NULL |     20 |
|  7839 | KING   | PRESIDENT | NULL | 1981-11-17 | 5000.00 |    NULL |     10 |
|  7844 | TURNER | SALESMAN  | 7698 | 1981-09-08 | 1500.00 |    0.00 |     30 |
|  7876 | ADAMS  | CLERK     | 7788 | 1987-05-23 | 1100.00 |    NULL |     20 |
|  7900 | JAMES  | CLERK     | 7698 | 1981-12-03 |  950.00 |    NULL |     30 |
|  7902 | FORD   | ANALYST   | 7566 | 1981-12-03 | 3000.00 |    NULL |     20 |
|  7934 | MILLER | CLERK     | 7782 | 1982-01-23 | 1300.00 |    NULL |     10 |
+-------+--------+-----------+------+------------+---------+---------+--------+

注意:原表数据不会被修改,只是查询结果去重。
去重需要使用一个关键字:distinct

mysql> select distinct job from emp;

+-----------+
| job       |
+-----------+
| CLERK     |
| SALESMAN  |
| MANAGER   |
| ANALYST   |
| PRESIDENT |
+-----------+

这样编写是错误的,语法错误。
distinct只能出现在所有字段的最前方。
mysql> select ename,distinct job from emp;

 distinct出现在job,deptno两个字段之前,表示两个字段联合起来去重。
mysql> select distinct job,deptno from emp;
+-----------+--------+
| job       | deptno |
+-----------+--------+
| CLERK     |     20 |
| SALESMAN  |     30 |
| MANAGER   |     20 |
| MANAGER   |     30 |
| MANAGER   |     10 |
| ANALYST   |     20 |
| PRESIDENT |     10 |
| CLERK     |     30 |
| CLERK     |     10 |
+-----------+--------+

统计一下工作岗位的数量?
	select count(distinct job) from emp;
	+---------------------+
	| count(distinct job) |
	+---------------------+
	|                   5 |
	+---------------------+

一、连接查询

1、什么是连接查询

从一张表中单独查询,称为单表查询。
         emp表和dept表联合起来查询数据,从emp表中取员工名字,从dept表中取部门名字。
         这种跨表查询,多张表联合起来查询数据,被称为连接查询。

2、连接查询的分类

根据表连接的方式分类:
①内连接:
                  等值连接
                  非等值连接
                  自连接

②外连接:
         左外连接(左连接)
         右外连接(右连接)

3、当两张表进行连接查询时,没有任何条件的限制会发生的现象

案例:查询每个员工所在部门名称?

	mysql> select ename,deptno from emp;
	+--------+--------+
	| ename  | deptno |
	+--------+--------+
	| SMITH  |     20 |
	| ALLEN  |     30 |
	| WARD   |     30 |
	| JONES  |     20 |
	| MARTIN |     30 |
	| BLAKE  |     30 |
	| CLARK  |     10 |
	| SCOTT  |     20 |
	| KING   |     10 |
	| TURNER |     30 |
	| ADAMS  |     20 |
	| JAMES  |     30 |
	| FORD   |     20 |
	| MILLER |     10 |
	+--------+--------+
	mysql> select * from dept;
	+--------+------------+----------+
	| DEPTNO | DNAME      | LOC      |
	+--------+------------+----------+
	|     10 | ACCOUNTING | NEW YORK |
	|     20 | RESEARCH   | DALLAS   |
	|     30 | SALES      | CHICAGO  |
	|     40 | OPERATIONS | BOSTON   |
	+--------+------------+----------+

两张表连接没有任何条件限制:

	select ename,dname from emp, dept;
	+--------+------------+
	| ename  | dname      |
	+--------+------------+
	| SMITH  | ACCOUNTING |
	| SMITH  | RESEARCH   |
	| SMITH  | SALES      |
	| SMITH  | OPERATIONS |
	| ALLEN  | ACCOUNTING |
	| ALLEN  | RESEARCH   |
	| ALLEN  | SALES      |
	| ALLEN  | OPERATIONS |
	...
	56 rows in set (0.00 sec)
	14 * 4 = 56

当两张表进行连接查询,没有任何条件限制的时候,最终查询结果条数,是两张表条数的乘积,这种现象被称为:笛卡尔积现象。(笛卡尔发现的,这是一个数学现象。)

4、避免笛卡尔积现象

连接时加条件,满足这个条件的记录被筛选出来

select 
	ename,dname 
from 
	emp, dept
where
	emp.deptno = dept.deptno;

select 
	emp.ename,dept.dname 
from 
	emp, dept
where
	emp.deptno = dept.deptno;

这里会显得很冗余,所以都会选择起别名,效率问题

select 
	e.ename,d.dname 
from 
	emp e, dept d
where
	e.deptno = d.deptno; //SQL92语法。


+--------+------------+
| ename  | dname      |
+--------+------------+
| CLARK  | ACCOUNTING |
| KING   | ACCOUNTING |
| MILLER | ACCOUNTING |
| SMITH  | RESEARCH   |
| JONES  | RESEARCH   |
| SCOTT  | RESEARCH   |
| ADAMS  | RESEARCH   |
| FORD   | RESEARCH   |
| ALLEN  | SALES      |
| WARD   | SALES      |
| MARTIN | SALES      |
| BLAKE  | SALES      |
| TURNER | SALES      |
| JAMES  | SALES      |
+--------+------------+

思考:最终查询的结果条数是14条,但是匹配的过程中,匹配的次数减少了吗?
还是56次,只不过进行了四选一。次数没有减少。

注意:通过笛卡尔积现象得出,表的连接次数越多效率越低,尽量避免表的
连接次数。

5、内连接之等值连接

案例:查询每个员工所在部门名称,显示员工名和部门名?
emp e和dept d表进行连接。条件是:e.deptno = d.deptno

select 
	e.ename,d.dname
from
	emp e
join
	dept d
on
	e.deptno = d.deptno;
	+--------+------------+
	| ename  | dname      |
	+--------+------------+
	| CLARK  | ACCOUNTING |
	| KING   | ACCOUNTING |
	| MILLER | ACCOUNTING |
	| SMITH  | RESEARCH   |
	| JONES  | RESEARCH   |
	| SCOTT  | RESEARCH   |
	| ADAMS  | RESEARCH   |
	| FORD   | RESEARCH   |
	| ALLEN  | SALES      |
	| WARD   | SALES      |
	| MARTIN | SALES      |
	| BLAKE  | SALES      |
	| TURNER | SALES      |
	| JAMES  | SALES      |
	+--------+------------+

6、内连接之非等值连接

案例:找出每个员工的薪资等级,要求显示员工名、薪资、薪资等级?

mysql> select * from emp; e
+-------+--------+-----------+------+------------+---------+---------+--------+
| EMPNO | ENAME  | JOB       | MGR  | HIREDATE   | SAL     | COMM    | DEPTNO |
+-------+--------+-----------+------+------------+---------+---------+--------+
|  7369 | SMITH  | CLERK     | 7902 | 1980-12-17 |  800.00 |    NULL |     20 |
|  7499 | ALLEN  | SALESMAN  | 7698 | 1981-02-20 | 1600.00 |  300.00 |     30 |
|  7521 | WARD   | SALESMAN  | 7698 | 1981-02-22 | 1250.00 |  500.00 |     30 |
|  7566 | JONES  | MANAGER   | 7839 | 1981-04-02 | 2975.00 |    NULL |     20 |
....

mysql> select * from salgrade; s
+-------+-------+-------+
| GRADE | LOSAL | HISAL |
+-------+-------+-------+
|     1 |   700 |  1200 |
|     2 |  1201 |  1400 |
|     3 |  1401 |  2000 |
|     4 |  2001 |  3000 |
|     5 |  3001 |  9999 |
+-------+-------+-------+

select
e.ename, e.sal, s.grade
from
emp e
join
salgrade s
on
e.sal between s.losal and s.hisal; // 条件不是一个等量关系,称为非等值连接。

+--------+---------+-------+
| ename  | sal     | grade |
+--------+---------+-------+
| SMITH  |  800.00 |     1 |
| ALLEN  | 1600.00 |     3 |
| WARD   | 1250.00 |     2 |
| JONES  | 2975.00 |     4 |
| MARTIN | 1250.00 |     2 |
| BLAKE  | 2850.00 |     4 |
| CLARK  | 2450.00 |     4 |
| SCOTT  | 3000.00 |     4 |
| KING   | 5000.00 |     5 |
| TURNER | 1500.00 |     3 |
| ADAMS  | 1100.00 |     1 |
| JAMES  |  950.00 |     1 |
| FORD   | 3000.00 |     4 |
| MILLER | 1300.00 |     2 |
+--------+---------+-------+

7、内连接之自连接

案例:查询员工的上级领导,要求显示员工名和对应的领导名

mysql> select empno,ename,mgr from emp;
+-------+--------+------+
| empno | ename  | mgr  |
+-------+--------+------+
|  7369 | SMITH  | 7902 |
|  7499 | ALLEN  | 7698 |
|  7521 | WARD   | 7698 |
|  7566 | JONES  | 7839 |
|  7654 | MARTIN | 7698 |
|  7698 | BLAKE  | 7839 |
|  7782 | CLARK  | 7839 |
|  7788 | SCOTT  | 7566 |
|  7839 | KING   | NULL |
|  7844 | TURNER | 7698 |
|  7876 | ADAMS  | 7788 |
|  7900 | JAMES  | 7698 |
|  7902 | FORD   | 7566 |
|  7934 | MILLER | 7782 |
+-------+--------+------+

技巧:一张表看成两张表。

emp a 员工表
+-------+--------+------+
| empno | ename  | mgr  |
+-------+--------+------+
|  7369 | SMITH  | 7902 |
|  7499 | ALLEN  | 7698 |
|  7521 | WARD   | 7698 |
|  7566 | JONES  | 7839 |
|  7654 | MARTIN | 7698 |
|  7698 | BLAKE  | 7839 |
|  7782 | CLARK  | 7839 |
|  7788 | SCOTT  | 7566 |
|  7839 | KING   | NULL |
|  7844 | TURNER | 7698 |
|  7876 | ADAMS  | 7788 |
|  7900 | JAMES  | 7698 |
|  7902 | FORD   | 7566 |
|  7934 | MILLER | 7782 |
+-------+--------+------+

emp b 领导表
+-------+--------+------+
| empno | ename  | mgr  |
+-------+--------+------+
|  7369 | SMITH  | 7902 |
|  7499 | ALLEN  | 7698 |
|  7521 | WARD   | 7698 |
|  7566 | JONES  | 7839 |
|  7654 | MARTIN | 7698 |
|  7698 | BLAKE  | 7839 |
|  7782 | CLARK  | 7839 |
|  7788 | SCOTT  | 7566 |
|  7839 | KING   | NULL |
|  7844 | TURNER | 7698 |
|  7876 | ADAMS  | 7788 |
|  7900 | JAMES  | 7698 |
|  7902 | FORD   | 7566 |
|  7934 | MILLER | 7782 |
+-------+--------+------+

select 
	a.ename as '员工名', b.ename as '领导名'
from
	emp a
join
	emp b
on
	a.mgr = b.empno; //员工的领导编号 = 领导的员工编号

+--------+--------+
| 员工名 | 领导名|
+--------+--------+
| SMITH  | FORD   |
| ALLEN  | BLAKE  |
| WARD   | BLAKE  |
| JONES  | KING   |
| MARTIN | BLAKE  |
| BLAKE  | KING   |
| CLARK  | KING   |
| SCOTT  | JONES  |
| TURNER | BLAKE  |
| ADAMS  | SCOTT  |
| JAMES  | BLAKE  |
| FORD   | JONES  |
| MILLER | CLARK  |
+--------+--------+

13条记录,没有KING。《内连接》

以上就是内连接中的:自连接,技巧:一张表看做两张表。

8、外连接

mysql> select * from emp; e
+-------+--------+-----------+------+------------+---------+---------+--------+
| EMPNO | ENAME  | JOB       | MGR  | HIREDATE   | SAL     | COMM    | DEPTNO |
+-------+--------+-----------+------+------------+---------+---------+--------+
|  7369 | SMITH  | CLERK     | 7902 | 1980-12-17 |  800.00 |    NULL |     20 |
|  7499 | ALLEN  | SALESMAN  | 7698 | 1981-02-20 | 1600.00 |  300.00 |     30 |
|  7521 | WARD   | SALESMAN  | 7698 | 1981-02-22 | 1250.00 |  500.00 |     30 |
|  7566 | JONES  | MANAGER   | 7839 | 1981-04-02 | 2975.00 |    NULL |     20 |
|  7654 | MARTIN | SALESMAN  | 7698 | 1981-09-28 | 1250.00 | 1400.00 |     30 |
|  7698 | BLAKE  | MANAGER   | 7839 | 1981-05-01 | 2850.00 |    NULL |     30 |
|  7782 | CLARK  | MANAGER   | 7839 | 1981-06-09 | 2450.00 |    NULL |     10 |
|  7788 | SCOTT  | ANALYST   | 7566 | 1987-04-19 | 3000.00 |    NULL |     20 |
|  7839 | KING   | PRESIDENT | NULL | 1981-11-17 | 5000.00 |    NULL |     10 |
|  7844 | TURNER | SALESMAN  | 7698 | 1981-09-08 | 1500.00 |    0.00 |     30 |
|  7876 | ADAMS  | CLERK     | 7788 | 1987-05-23 | 1100.00 |    NULL |     20 |
|  7900 | JAMES  | CLERK     | 7698 | 1981-12-03 |  950.00 |    NULL |     30 |
|  7902 | FORD   | ANALYST   | 7566 | 1981-12-03 | 3000.00 |    NULL |     20 |
|  7934 | MILLER | CLERK     | 7782 | 1982-01-23 | 1300.00 |    NULL |     10 |
+-------+--------+-----------+------+------------+---------+---------+--------+

mysql> select * from dept; d
+--------+------------+----------+
| DEPTNO | DNAME      | LOC      |
+--------+------------+----------+
|     10 | ACCOUNTING | NEW YORK |
|     20 | RESEARCH   | DALLAS   |
|     30 | SALES      | CHICAGO  |
|     40 | OPERATIONS | BOSTON   |
+--------+------------+----------+

内连接:(A和B连接,AB两张表没有主次关系。平等的。)
select
        e.ename,d.dname
from
        emp e
join
        dept d
on
        e.deptno = d.deptno; //内连接的特点:完成能够匹配上这个条件的数据查询出来。

+--------+------------+
| ename  | dname      |
+--------+------------+
| CLARK  | ACCOUNTING |
| KING   | ACCOUNTING |
| MILLER | ACCOUNTING |
| SMITH  | RESEARCH   |
| JONES  | RESEARCH   |
| SCOTT  | RESEARCH   |
| ADAMS  | RESEARCH   |
| FORD   | RESEARCH   |
| ALLEN  | SALES      |
| WARD   | SALES      |
| MARTIN | SALES      |
| BLAKE  | SALES      |
| TURNER | SALES      |
| JAMES  | SALES      |
+--------+------------+

外连接(右外连接):
select
        e.ename,d.dname
from
        emp e
right join
        dept d
on
        e.deptno = d.deptno;

// outer是可以省略的,带着可读性强。
select
        e.ename,d.dname
from
        emp e
right outer join
        dept d
on
        e.deptno = d.deptno;

right代表什么:表示将join关键字右边的这张表看成主表,主要是为了将这张表的数据全部查询出来,捎带着关联查询左边的表。在外连接当中,两张表连接,产生了主次关系。

外连接(左外连接):
select
        e.ename,d.dname
from
        dept d
left join
        emp e
on
        e.deptno = d.deptno;

以上两个语句产生的效果一样

带有right的是右外连接,又叫做右连接。
带有left的是左外连接,又叫做左连接。
任何一个右连接都有左连接的写法。
任何一个左连接都有右连接的写法。

+--------+------------+
| ename  | dname      |
+--------+------------+
| CLARK  | ACCOUNTING |
| KING   | ACCOUNTING |
| MILLER | ACCOUNTING |
| SMITH  | RESEARCH   |
| JONES  | RESEARCH   |
| SCOTT  | RESEARCH   |
| ADAMS  | RESEARCH   |
| FORD   | RESEARCH   |
| ALLEN  | SALES      |
| WARD   | SALES      |
| MARTIN | SALES      |
| BLAKE  | SALES      |
| TURNER | SALES      |
| JAMES  | SALES      |
| NULL   | OPERATIONS |
+--------+------------+

思考:外连接的查询结果条数一定是 >= 内连接的查询结果条数?
正确。

案例:查询每个员工的上级领导,要求显示所有员工的名字和领导名?

select 
		a.ename as '员工名', b.ename as '领导名'
	from
		emp a
	left join
		emp b
	on
		a.mgr = b.empno; 
	
	+--------+--------+
	| 员工名      | 领导名     |
	+--------+--------+
	| SMITH  | FORD   |
	| ALLEN  | BLAKE  |
	| WARD   | BLAKE  |
	| JONES  | KING   |
	| MARTIN | BLAKE  |
	| BLAKE  | KING   |
	| CLARK  | KING   |
	| SCOTT  | JONES  |
	| KING   | NULL   |
	| TURNER | BLAKE  |
	| ADAMS  | SCOTT  |
	| JAMES  | BLAKE  |
	| FORD   | JONES  |
	| MILLER | CLARK  |
	+--------+--------+

9、三张表,四张表的连接

语法:
select
        …
from
        a
join
        b
on
        a和b的连接条件
join
        c
on
        a和c的连接条件
right join
        d
on
        a和d的连接条件

一条SQL中内连接和外连接可以混合。都可以出现!

案例:找出每个员工的部门名称以及工资等级,
要求显示员工名、部门名、薪资、薪资等级?

select 
		e.ename,e.sal,d.dname,s.grade
	from
		emp e
	join
		dept d
	on 
		e.deptno = d.deptno
	join
		salgrade s
	on
		e.sal between s.losal and s.hisal;
	
	+--------+---------+------------+-------+
	| ename  | sal     | dname      | grade |
	+--------+---------+------------+-------+
	| SMITH  |  800.00 | RESEARCH   |     1 |
	| ALLEN  | 1600.00 | SALES      |     3 |
	| WARD   | 1250.00 | SALES      |     2 |
	| JONES  | 2975.00 | RESEARCH   |     4 |
	| MARTIN | 1250.00 | SALES      |     2 |
	| BLAKE  | 2850.00 | SALES      |     4 |
	| CLARK  | 2450.00 | ACCOUNTING |     4 |
	| SCOTT  | 3000.00 | RESEARCH   |     4 |
	| KING   | 5000.00 | ACCOUNTING |     5 |
	| TURNER | 1500.00 | SALES      |     3 |
	| ADAMS  | 1100.00 | RESEARCH   |     1 |
	| JAMES  |  950.00 | SALES      |     1 |
	| FORD   | 3000.00 | RESEARCH   |     4 |
	| MILLER | 1300.00 | ACCOUNTING |     2 |
	+--------+---------+------------+-------+

案例:找出每个员工的部门名称以及工资等级,还有上级领导,
要求显示员工名、领导名、部门名、薪资、薪资等级?

select 
		e.ename,e.sal,d.dname,s.grade,l.ename
	from
		emp e
	join
		dept d
	on 
		e.deptno = d.deptno
	join
		salgrade s
	on
		e.sal between s.losal and s.hisal
	left join
		emp l
	on
		e.mgr = l.empno;
	
	+--------+---------+------------+-------+-------+
	| ename  | sal     | dname      | grade | ename |
	+--------+---------+------------+-------+-------+
	| SMITH  |  800.00 | RESEARCH   |     1 | FORD  |
	| ALLEN  | 1600.00 | SALES      |     3 | BLAKE |
	| WARD   | 1250.00 | SALES      |     2 | BLAKE |
	| JONES  | 2975.00 | RESEARCH   |     4 | KING  |
	| MARTIN | 1250.00 | SALES      |     2 | BLAKE |
	| BLAKE  | 2850.00 | SALES      |     4 | KING  |
	| CLARK  | 2450.00 | ACCOUNTING |     4 | KING  |
	| SCOTT  | 3000.00 | RESEARCH   |     4 | JONES |
	| KING   | 5000.00 | ACCOUNTING |     5 | NULL  |
	| TURNER | 1500.00 | SALES      |     3 | BLAKE |
	| ADAMS  | 1100.00 | RESEARCH   |     1 | SCOTT |
	| JAMES  |  950.00 | SALES      |     1 | BLAKE |
	| FORD   | 3000.00 | RESEARCH   |     4 | JONES |
	| MILLER | 1300.00 | ACCOUNTING |     2 | CLARK |
	+--------+---------+------------+-------+-------+

二、子查询

1.什么是子查询

select语句中嵌套select语句,被嵌套的select语句称为子查询。

2、子查询都可以出现在哪里

select
      …(select).
from
      …(select).
where
      …(select).

3、where子句中的子查询

案例:找出比最低工资高的员工姓名和工资?

select 
			ename,sal
		from
			emp 
		where
			sal > min(sal);
			ERROR 1111 (HY000): Invalid use of group function
	where子句中不能直接使用分组函数。

实现思路:
	第一步:查询最低工资是多少
		select min(sal) from emp;
		+----------+
		| min(sal) |
		+----------+
		|   800.00 |
		+----------+
	第二步:找出>800的
		select ename,sal from emp where sal > 800;
	
	第三步:合并
		select ename,sal from emp where sal > (select min(sal) from emp);
		+--------+---------+
		| ename  | sal     |
		+--------+---------+
		| ALLEN  | 1600.00 |
		| WARD   | 1250.00 |
		| JONES  | 2975.00 |
		| MARTIN | 1250.00 |
		| BLAKE  | 2850.00 |
		| CLARK  | 2450.00 |
		| SCOTT  | 3000.00 |
		| KING   | 5000.00 |
		| TURNER | 1500.00 |
		| ADAMS  | 1100.00 |
		| JAMES  |  950.00 |
		| FORD   | 3000.00 |
		| MILLER | 1300.00 |
		+--------+---------+

4、from子句中的子查询

注意:from后面的子查询,可以将子查询的查询结果当做一张临时表。(技巧)

案例:找出每个岗位的平均工资的薪资等级。

第一步:找出每个岗位的平均工资(按照岗位分组求平均值)
	select job,avg(sal) from emp group by job;
	+-----------+-------------+
	| job       | avgsal      |
	+-----------+-------------+
	| ANALYST   | 3000.000000 |
	| CLERK     | 1037.500000 |
	| MANAGER   | 2758.333333 |
	| PRESIDENT | 5000.000000 |
	| SALESMAN  | 1400.000000 |
	+-----------+-------------+t表

第二步:克服心理障碍,把以上的查询结果就当做一张真实存在的表t。
mysql> select * from salgrade; s表
+-------+-------+-------+
| GRADE | LOSAL | HISAL |
+-------+-------+-------+
|     1 |   700 |  1200 |
|     2 |  1201 |  1400 |
|     3 |  1401 |  2000 |
|     4 |  2001 |  3000 |
|     5 |  3001 |  9999 |
+-------+-------+-------+
t表和s表进行表连接,条件:t表avg(sal) between s.losal and s.hisal;
	
	select 
		t.*, s.grade
	from
		(select job,avg(sal) as avgsal from emp group by job) t
	join
		salgrade s
	on
		t.avgsal between s.losal and s.hisal;
	
	+-----------+-------------+-------+
	| job       | avgsal      | grade |
	+-----------+-------------+-------+
	| CLERK     | 1037.500000 |     1 |
	| SALESMAN  | 1400.000000 |     2 |
	| ANALYST   | 3000.000000 |     4 |
	| MANAGER   | 2758.333333 |     4 |
	| PRESIDENT | 5000.000000 |     5 |
	+-----------+-------------+-------+

三、union合并查询结果集

案例:查询工作岗位是MANAGER和SALESMAN的员工

        select ename,job from emp where job = ‘MANAGER’ or job = ‘SALESMAN’;
        select ename,job from emp where job in(‘MANAGER’,‘SALESMAN’);

	+--------+----------+
	| ename  | job      |
	+--------+----------+
	| ALLEN  | SALESMAN |
	| WARD   | SALESMAN |
	| JONES  | MANAGER  |
	| MARTIN | SALESMAN |
	| BLAKE  | MANAGER  |
	| CLARK  | MANAGER  |
	| TURNER | SALESMAN |
	+--------+----------+

        select ename,job from emp where job = ‘MANAGER’
        union
        select ename,job from emp where job = ‘SALESMAN’;

	+--------+----------+
	| ename  | job      |
	+--------+----------+
	| JONES  | MANAGER  |
	| BLAKE  | MANAGER  |
	| CLARK  | MANAGER  |
	| ALLEN  | SALESMAN |
	| WARD   | SALESMAN |
	| MARTIN | SALESMAN |
	| TURNER | SALESMAN |
	+--------+----------+

union的效率要高一些。对于表连接来说,每连接一次新表,则匹配的次数满足笛卡尔积,成倍的翻,但是union可以减少匹配的次数。在减少匹配次数的情况下,还可以完成两个结果集的拼接。

a 连接 b 连接 c
        a 10条记录
        b 10条记录
        c 10条记录
匹配次数是:1000

a 连接 b一个结果:10 * 10 --> 100次
a 连接 c一个结果:10 * 10 --> 100次
使用union的话是:100次 + 100次 = 200次。(union把乘法变成了加法运算)

union在使用的时候有注意事项吗?

//错误的:union在进行结果集合并的时候,要求两个结果集的列数相同。
select ename,job from emp where job = ‘MANAGER’
union
select ename from emp where job = ‘SALESMAN’;

// MYSQL可以,oracle语法严格 ,不可以,报错。要求:结果集合并时列和列的数据类型也要一致。
select ename,job from emp where job = ‘MANAGER’
union
select ename,sal from emp where job = ‘SALESMAN’;

	+--------+---------+
	| ename  | job     |
	+--------+---------+
	| JONES  | MANAGER |
	| BLAKE  | MANAGER |
	| CLARK  | MANAGER |
	| ALLEN  | 1600    |
	| WARD   | 1250    |
	| MARTIN | 1250    |
	| TURNER | 1500    |
	+--------+---------+

四、limit(非常重要)

1、limit作用

将查询结果集的一部分取出来。通常使用在分页查询当中。

百度默认:一页显示10条记录。

分页的作用是为了提高用户的体验,因为一次全部都查出来,用户体验差。可以一页一页翻页看。

2、limit怎么用

完整用法:limit startIndex, length
        startIndex是起始下标,length是长度。
        起始下标从0开始。

缺省用法:limit 5; 这是取前5.

按照薪资降序,取出排名在前5名的员工

select 
		ename,sal
	from
		emp
	order by 
		sal desc
	limit 5; //取前5

	select 
		ename,sal
	from
		emp
	order by 
		sal desc
	limit 0,5;

	+-------+---------+
	| ename | sal     |
	+-------+---------+
	| KING  | 5000.00 |
	| SCOTT | 3000.00 |
	| FORD  | 3000.00 |
	| JONES | 2975.00 |
	| BLAKE | 2850.00 |
	+-------+---------+
取出工资排名在[3-5]名的员工?
	select 
		ename,sal
	from
		emp
	order by
		sal desc
	limit
		2, 3;
	
	2表示起始位置从下标2开始,就是第三条记录。
	3表示长度。

	+-------+---------+
	| ename | sal     |
	+-------+---------+
	| FORD  | 3000.00 |
	| JONES | 2975.00 |
	| BLAKE | 2850.00 |
	+-------+---------+

取出工资排名在[5-9]名的员工?
	select 
		ename,sal
	from
		emp
	order by 
		sal desc
	limit
		4, 5;

	+--------+---------+
	| ename  | sal     |
	+--------+---------+
	| BLAKE  | 2850.00 |
	| CLARK  | 2450.00 |
	| ALLEN  | 1600.00 |
	| TURNER | 1500.00 |
	| MILLER | 1300.00 |
	+--------+---------+

注意:mysql当中limit在order by之后执行!!!!!!

3、分页

每页显示3条记录
        第1页:limit 0,3 [0 1 2]
        第2页:limit 3,3 [3 4 5]
        第3页:limit 6,3 [6 7 8]
        第4页:limit 9,3 [9 10 11]

每页显示pageSize条记录
        第pageNo页:limit (pageNo - 1) * pageSize , pageSize

public static void main(String[] args){
	// 用户提交过来一个页码,以及每页显示的记录条数
	int pageNo = 5; //第5页
	int pageSize = 10; //每页显示10条

	int startIndex = (pageNo - 1) * pageSize;
	String sql = "select ...limit " + startIndex + ", " + pageSize;
}

记公式:
limit (pageNo-1)*pageSize , pageSize

五、DQL语句的大总结

select
        …
from
        …
where
        …
group by
        …
having
        …
order by
        …
limit
        …

执行顺序
        1.from
        2.where
        3.group by
        4.having
        5.select
        6.order by
        7.limit…

六、表的创建(建表)

建表的语法格式:(建表属于DDL语句,DDL包括:create drop alter)

create table 表名(字段名1 数据类型, 字段名2 数据类型, 字段名3 数据类型);

create table 表名(
        字段名1 数据类型,
        字段名2 数据类型,
        字段名3 数据类型
);

表名:建议以t_ 或者 tbl_开始,可读性强。见名知意。
        字段名:见名知意。
        表名和字段名都属于标识符。

1.关于mysql中的数据类型

    1.varchar(最长255)
		可变长度的字符串
		比较智能,节省空间。
		会根据实际的数据长度动态分配空间。

	优点:节省空间
		缺点:需要动态分配空间,速度慢。

	2.char(最长255)
		定长字符串
		不管实际的数据长度是多少。
		分配固定长度的空间去存储数据。
		使用不恰当的时候,可能会导致空间的浪费。

		优点:不需要动态分配空间,速度快。
		缺点:使用不当可能会导致空间的浪费。

		varchar和char我们应该怎么选择?
			性别字段你选什么?因为性别是固定长度的字符串,所以选择char。
			姓名字段你选什么?每一个人的名字长度不同,所以选择varchar。

	3.int(最长11)
		数字中的整数型。等同于java的int。

	4.bigint
		数字中的长整型。等同于java中的long。

	5.float	
		单精度浮点型数据

	6.double
		双精度浮点型数据

	7.date
		短日期类型

	8.datetime
		长日期类型

	9.clob
		字符大对象
		最多可以存储4G的字符串。
		比如:存储一篇文章,存储一个说明。
		超过255个字符的都要采用CLOB字符大对象来存储。
		Character Large OBject:CLOB


	10.blob
		二进制大对象
		Binary Large OBject
		专门用来存储图片、声音、视频等流媒体数据。
		往BLOB类型的字段上插入数据的时候,例如插入一个图片、视频等,
		你需要使用IO流才行。

2.创建与删除一个学生表

学号、姓名、年龄、性别、邮箱地址

create table t_student(
		no int,
		name varchar(32),
		sex char(1),
		age int(3),
		email varchar(255)
	);

删除表:
drop table t_student; // 当这张表不存在的时候会报错!

// 如果这张表存在的话,删除
drop table if exists t_student;

3.插入数据insert(DML)

语法格式:
insert into 表名(字段名1,字段名2,字段名3…) values(值1,值2,值3);

	注意:字段名和值要一一对应。什么是一一对应?
		数量要对应。数据类型要对应。

insert into t_student(no,name,sex,age,email) values(1,'zhangsan','m',20,'zhangsan@123.com');
insert into t_student(email,name,sex,age,no) values('lisi@123.com','lisi','f',20,2);

insert into t_student(no) values(3);

+------+----------+------+------+------------------+
| no   | name     | sex  | age  | email            |
+------+----------+------+------+------------------+
|    1 | zhangsan | m    |   20 | zhangsan@123.com |
|    2 | lisi     | f    |   20 | lisi@123.com     |
|    3 | NULL     | NULL | NULL | NULL             |
+------+----------+------+------+------------------+
insert into t_student(name) values('wangwu');
+------+----------+------+------+------------------+
| no   | name     | sex  | age  | email            |
+------+----------+------+------+------------------+
|    1 | zhangsan | m    |   20 | zhangsan@123.com |
|    2 | lisi     | f    |   20 | lisi@123.com     |
|    3 | NULL     | NULL | NULL | NULL             |
| NULL | wangwu   | NULL | NULL | NULL             |
+------+----------+------+------+------------------+
注意:insert语句但凡是执行成功了,那么必然会多一条记录。
没有给其它字段指定值的话,默认值是NULL。

假如插入时省略了insert语句中的“字段名”,那么等于字段都写上了,所以值也要都写上。

insert into t_student values(2, 'lisi', 'f', 20, 'lisi@123.com');
		+------+------+------+------+--------------+
		| no   | name | sex  | age  | email        |
		+------+------+------+------+--------------+
		|    1 | NULL | m    | NULL | NULL         |
		|    2 | lisi | f    |   20 | lisi@123.com |
		+------+------+------+------+--------------+

4.insert插入日期

str_to_date:将字符串varchar类型转换成date类型
date_format:将date类型转换成具有一定格式的varchar字符串类型。

drop table if exists t_user;
create table t_user(
	id int,
	name varchar(32),
	birth date // 生日也可以使用date日期类型
);

create table t_user(
	id int,
	name varchar(32),
	birth char(10) // 生日可以使用字符串,没问题。
);

生日:1990-10-11 (10个字符)

注意:数据库中的有一条命名规范:
	所有的标识符都是全部小写,单词和单词之间使用下划线进行衔接。

mysql> desc t_user;
+-------+-------------+------+-----+---------+-------+
| Field | Type        | Null | Key | Default | Extra |
+-------+-------------+------+-----+---------+-------+
| id    | int(11)     | YES  |     | NULL    |       |
| name  | varchar(32) | YES  |     | NULL    |       |
| birth | date        | YES  |     | NULL    |       |
+-------+-------------+------+-----+---------+-------+

插入数据
insert into t_user(id,name,birth) values(1, ‘zhangsan’, ‘01-10-1990’); // 1990年10月1日
出问题了:原因是类型不匹配。数据库birth是date类型,这里给了一个字符串varchar。

怎么办?可以使用str_to_date函数进行类型转换。
str_to_date函数可以将字符串转换成日期类型date
语法格式:
str_to_date(‘字符串日期’, ‘日期格式’)

	mysql的日期格式:
		%Y	年
		%m 月
		%d 日
		%h	时
		%i	分
		%s	秒
	
	insert into t_user(id,name,birth) values(1, 'zhangsan', str_to_date('01-10-1990','%d-%m-%Y'));

	str_to_date函数可以把字符串varchar转换成日期date类型数据,
	通常使用在插入insert方面,因为插入的时候需要一个日期类型的数据,
	需要通过该函数将字符串转换成date。

如果你提供的日期字符串是这个格式,str_to_date函数就不需要了!!!
%Y-%m-%d
insert into t_user(id,name,birth) values(2, ‘lisi’, ‘1990-10-01’);

查询的时候可以以某个特定的日期格式展示吗?
date_format
这个函数可以将日期类型转换成特定格式的字符串。

	select id,name,date_format(birth, '%m/%d/%Y') as birth from t_user;
	+------+----------+------------+
	| id   | name     | birth      |
	+------+----------+------------+
	|    1 | zhangsan | 10/01/1990 |
	|    2 | lisi     | 10/01/1990 |
	+------+----------+------------+

	date_format函数怎么用?
		date_format(日期类型数据, '日期格式')
		这个函数通常使用在查询日期方面。设置展示的日期格式。
	
	mysql> select id,name,birth from t_user;
	+------+----------+------------+
	| id   | name     | birth      |
	+------+----------+------------+
	|    1 | zhangsan | 1990-10-01 |
	|    2 | lisi     | 1990-10-01 |
	+------+----------+------------+
	以上的SQL语句实际上是进行了默认的日期格式化,
	自动将数据库中的date类型转换成varchar类型。
	并且采用的格式是mysql默认的日期格式:'%Y-%m-%d'

	select id,name,date_format(birth,'%Y/%m/%d') as birth from t_user;
	
	java中的日期格式
		yyyy-MM-dd HH:mm:ss SSS

5.date和datetime两个类型的区别

date是短日期:只包括年月日信息。
datetime是长日期:包括年月日时分秒信息。

drop table if exists t_user;
create table t_user(
	id int,
	name varchar(32),
	birth date,
	create_time datetime
);


id是整数
name是字符串
birth是短日期
create_time是这条记录的创建时间:长日期类型

mysql短日期默认格式:%Y-%m-%d
mysql长日期默认格式:%Y-%m-%d %h:%i:%s

insert into t_user(id,name,birth,create_time) values(1,'zhangsan','1990-10-01','2020-03-18 15:49:50');

在mysql当中怎么获取系统当前时间?
	now() 函数,并且获取的时间带有:时分秒信息!!!!是datetime类型的。

	insert into t_user(id,name,birth,create_time) values(2,'lisi','1991-10-01',now());

6.修改update(DML)

语法格式:
update 表名 set 字段名1=值1,字段名2=值2,字段名3=值3… where 条件;

注意:没有条件限制会导致所有数据全部更新。

update t_user set name = 'jack', birth = '2000-10-11' where id = 2;
	+------+----------+------------+---------------------+
	| id   | name     | birth      | create_time         |
	+------+----------+------------+---------------------+
	|    1 | zhangsan | 1990-10-01 | 2020-03-18 15:49:50 |
	|    2 | jack     | 2000-10-11 | 2020-03-18 15:51:23 |
	+------+----------+------------+---------------------+

7.删除数据 delete (DML)

语法格式
delete from 表名 where 条件;

注意:没有条件,整张表的数据会全部删除!

delete from t_user where id = 2;

	insert into t_user(id) values(2);

	delete from t_user; // 删除所有!
<think>好的,我现在需要解决用户的问题:为什么子查询中不能使用GROUP BY以及如何解决这个问题。首先,我得回忆一下相关的SQL知识,并结合用户提供的引用内容来分析。 根据引用[3],用户提到在MySQL 5.7版本中,子查询中的ORDER BY可能会被忽略,特别是当Derived table不包含UNION、GROUP BY、DISTINCT、聚合函数、LIMIT或OFFSET时。这可能是因为优化器进行了优化,认为某些情况下排序是不必要的。但用户的问题是GROUP BY在子查询中的限制,这可能与优化器的处理方式有关。 接下来,引用[4]指出,在使用GROUP BY时,查询中的字段必须包含在GROUP BY子句中或在聚合函数中。这通常是在主查询中的限制,但子查询中的GROUP BY是否也会有类似的问题呢?比如,子查询中的GROUP BY如果没有正确聚合字段,可能导致外部查询出现问题。 用户提供的引用[5]提到GROUP BY SUM查询慢的问题,可能与执行计划有关,但这里的问题更侧重于限制而非性能。引用[2]展示了如何在子查询中使用GROUP_CONCATDISTINCT,通过子查询处理数据后再聚合,这可能是一种解决方案的思路。 现在,我需要将这些信息整合起来。首先,子查询中使用GROUP BY的限制可能源于数据库优化器的处理方式,例如MySQL可能会忽略子查询中的ORDER BY,但GROUP BY是否会被忽略?根据引用[3],如果子查询中包含GROUP BY,可能不会被优化器忽略,但可能存在其他问题,比如外部查询引用子查询中的字段时出现聚合错误。 例如,假设在子查询中使用GROUP BY,但外部查询试图选择未聚合的字段,这会导致错误。解决方法可能是在子查询中正确使用聚合函数,或者在外部查询中再次处理数据。例如,引用[4]提到,主查询中的字段必须被聚合,这可能同样适用于子查询中的GROUP BY结果。 另外,引用[2]的例子使用子查询来处理DISTINCT,然后再进行GROUP_CONCAT,这说明子查询可以有效地处理分组去重,但需要正确的语法结构。可能的问题在于子查询中的GROUP BY如果没有正确使用聚合函数,会导致外部查询无法正确引用字段。 总结可能的原因为: 1. 数据库优化器对子查询中的GROUP BY进行了优化或忽略。 2. 子查询中的GROUP BY未正确聚合字段,导致外部查询引用错误。 3. 不同数据库(如MySQLSQLServer)对子查询中GROUP BY的处理方式不同。 解决方案可能包括: 1. 在子查询中明确使用聚合函数,确保字段都被正确聚合。 2. 使用派生或临时来存储子查询结果,再在外部查询中处理。 3. 调整数据库配置或使用提示(hints)来避免优化器忽略子查询中的GROUP BY。 需要结合具体的例子来说明问题,比如用户提到的引用[3]中的情况,当子查询包含GROUP BY时,可能不会被优化器忽略,但外部查询需要正确处理聚合字段。例如,在子查询中使用GROUP BY后,外部查询可能需要再次聚合或使用窗口函数来处理数据。 可能还需要检数据库版本文档,确认不同版本对子查询中GROUP BY的支持情况,以及是否存在已知的问题或解决方案。例如,MySQL 5.78.0在处理子查询时的行为可能不同,需要具体分析。 最后,结合用户的引用内容,特别是引用[3][4],给出具体的解决方案步骤,比如在子查询中正确使用聚合函数,或者在外部查询中处理分组后的数据。</think>### 子查询中 GROUP BY 的限制及解决方案 #### 一、子查询中 GROUP BY 的限制原因 1. **数据库优化器行为** 在 MySQL 5.7+ 版本中,优化器可能对子查询进行重写或优化,导致子查询中的 `GROUP BY` 被忽略或失效[^3]。例如,当子查询未包含 `LIMIT`、`UNION`、`DISTINCT` 等操作时,优化器可能认为 `GROUP BY` 是冗余的。 2. **作用域限制** 子查询的 `GROUP BY` 作用域仅限其内部,若外部查询需要引用分组后的字段,需通过聚合函数或派生重新处理,否则可能引发语法错误[^4]。 3. **字段聚合规则** 若子查询中 `GROUP BY` 未正确聚合字段,而外部查询直接引用未聚合字段,数据库会报错(如 SQL Server 中要求所有非聚合字段必须出现在 `GROUP BY` 子句中)[^4]。 --- #### 、解决方案及示例 ##### 场景1:子查询分组后需保留多行数据 **问题示例** 以下查询尝试在子查询中分组并保留最新记录,但可能因优化器忽略 `ORDER BY` 导致失效[^3]: ```sql SELECT a.* FROM ( SELECT * FROM orders WHERE groupId = 11 ORDER BY effectiveDate DESC -- 可能被优化器忽略 ) a GROUP BY a.groupId; ``` **解决方案** 通过 **派生 + 临时排序** 强制保留顺序,再分组取最新记录: ```sql SELECT a.* FROM ( SELECT *, ROW_NUMBER() OVER (PARTITION BY groupId ORDER BY effectiveDate DESC) AS rn FROM orders WHERE groupId = 11 ) a WHERE a.rn = 1; ``` --- ##### 场景2:子查询分组后需聚合统计 **问题示例** 子查询中 `GROUP BY` 统计部门人数,但外部查询直接引用非聚合字段: ```sql SELECT d.department_name, e.employee_count FROM departments d LEFT JOIN ( SELECT department_id, COUNT(*) AS employee_count FROM employees GROUP BY department_id ) e ON d.id = e.department_id; ``` **解决方案** 若需在子查询中分组后保留非聚合字段,需在子查询中显式聚合: ```sql SELECT d.department_name, MAX(e.employee_count) AS employee_count FROM departments d LEFT JOIN ( SELECT department_id, COUNT(*) AS employee_count FROM employees GROUP BY department_id ) e ON d.id = e.department_id GROUP BY d.department_name; ``` --- ##### 场景3:多层嵌套分组 **问题示例** 多层子查询中分组逻辑复杂导致性能下降[^5]: ```sql SELECT region, SUM(total_sales) FROM ( SELECT region, product_category, SUM(sales) AS total_sales FROM sales_data GROUP BY region, product_category ) subquery GROUP BY region; ``` **优化方案** 合并分组层级或使用窗口函数: ```sql SELECT region, SUM(SUM(sales)) OVER (PARTITION BY region) AS total_sales FROM sales_data GROUP BY region, product_category; ``` --- #### 三、关键总结 | 问题类型 | 解决方案 | |-------------------------|--------------------------------------------------------------------------| | 优化器忽略子查询分组 | 使用窗口函数或派生强制保留排序[^3] | | 外部查询引用非聚合字段 | 在子查询中显式聚合,或在外部查询中重新聚合 | | 多层分组性能低下 | 减少嵌套层级,使用窗口函数或合并分组条件[^5] | ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值