DQL-连接查询
1.1 笛卡尔积
笛卡尔积,也有的叫笛卡尔乘积
多表查询中,链接的where限定条件,不能少于 表的个数-1 , 否则就会发生笛卡尔乘积 , 这个限定条件并不是随便一个限定条件,而是用于维护映射两个表的条件,比如 外键
笛卡尔乘积是一个很消耗内存的运算,笛卡尔积产生的新表,行数是原来两个表行数的乘积,列数是原来两个表列数的和。所以我们在表连接时要使用一些优化手段,避免出现笛卡尔乘积。
最简单的多表查询 : select * from 表1,表2;
示例数据 :
create table teacher(
id int ,
name varchar(20),
primary key (id)
);
create table student (
id int ,
name varchar(20),
teacher_id int ,
primary key (id),
foreign key (teacher_id) references teacher(id)
);
insert into teacher (id,name) values(1,‘张老师’);
insert into teacher (id,name) values(2,‘王老师’);
insert into student (id,name,teacher_id) values(1,‘小明’,1);
insert into student (id,name) values(2,‘小红’);
insert into student (id,name,teacher_id) values(3,‘小黑’,2);
每个行都有两次
如果直接就是写的select * from teacher,student; ,那么 结果的条数等于两个表的乘积
所以 判断条件最少也要是1个,也就是两个表的个数-1
条数对了,因为小红没有teacher_id所以不会被查询出来
虽然条数对了,但是也会先发生一个完全的笛卡尔乘积,然后在新视图中找匹配的数据,再展示匹配的数据,会消耗内存一些
所以不推荐使用,推荐使用链接查询
优化上面的笛卡尔乘积的方式
优化一:使用等值连接条件,比如上面的where s.teahcer_id = t.id。
优化二:能使用inner join的就不要使用left join。
优化三:使用记录数更少的表当左表。
但是如果业务上有要求:
比如,我们有一张用户的基本信息表,我们还有一张用户的订单表
现在我们要求在页面上展示,所有用户的订单记录
这种情况下我们就必须使用left join了,因为inner join 会丢数据
假设基本信息表中有A B C三个用户(3条记录)订单表中有A B两个人的100条订单记录
这种情况下,我们除了使用left join外,还必须要让基本信息表当左表,订单表当右表。
MYSQL支持的表连接查询有inner join,left join,right join(right join我们工作中基本不用)。
1.2 inner join
插入一条示例数据
INSERT INTO teacher (id
, name
) VALUES (‘3’, ‘孙老师’);
1
select *from teacher teainner join student stu on tea.id = stu.teacher_id;
2
select *from student stuinner join teacher tea on tea.id = stu.teacher_id;
总结 :
数据库在通过连接两张或多张表来返回记录时,都会生成一张中间的临时表,然后再将这张临时表返回给用户。
在使用 join 连接查询 时,on和where条件的区别如下:
1、on条件是在生成临时表时使用的条件,需要和链接查询一起使用。
2、where条件是在临时表生成好后,再对临时表进行过滤的条件。这时已经没有join的含义(必须返回左边表的记录)了,条件不为真的就全部过滤掉。
链接查询,会发生笛卡尔乘积,但是不是完全的笛卡尔乘积,在生成视图的时候,会进行匹配,不符合条件的就不要了
结果数据是以左表数据为准,先生成左表数据,再生成右表数据
使用内连接的话,会以左边表为基准(student),生成新视图的时候,先生成左边表中的数据,然后再去匹配右边表中是否有符合条件的,没有的话,就不生成这一行
同时左表中有的,右表中没有的数据,都不会生成
右表中有的,左表中没有的也一样不会生成,所以 左表和右表就算换了位置,数据行数不会变多
但是会丢失数据,不符合 条件的数据不会查询出来,所以 刚添加的 孙老师就不会查询出来的,就算是teacher表在左边,也一样不会查询出来孙老师,并且学生小红也没有被查询处理
因为学生表中 teacher_id列 没有保存孙老师的ID,并且小红也没有保存老师的ID,所以都不要
多表查询是有左右表之分的,一般左表是主表,以左边为主
1.3 left join
left join on : 左连接,又称左外链接,是 left outer join 的简写 ,使用left join 和 使用 left outer join 是一样的效果
1 查询结果,显示小红,但是不显示孙老师
select * from student s left join teacher t on s.teacher_id = t.id;
2 查询结果显示孙老师,但是不显示小红
select * from teacher t left join student s on s.teacher_id = t.id;
总结 :
以左边的表为基准,左表中数据都有,右表中不符合条件的就没有,就在指定列上用null代替
生成视图的时候,也是先生成左表的数据
1.4 right join
right join on : 右链接,又称右外连接,是 right outer join 的简写,使用right join 和 使用 right outer join 是一样的
1 查询结果,显示孙老师,但是不显示小红
select * from student s right join teacher t on s.teacher_id = t.id;
2 查询结果显示小红,但是不显示孙老师
select * from teacher t right join student s on s.teacher_id = t.id;
总结 :
以右表为基准,右表中数据都有,左表中不符合条件的就没有,就在指定列上用null代替
但是视图生成的时候,还是会先生成左表数据
以上可以看出,student right join teacher 显示的内容是与teacher left join student相同的。而teacher right join student 显示的内容又与student left join student相同。
所以,我们工作中,right join基本不用。用的最多的是inner join 与left join。
PS:外键与表连接没有任何关系,不要混淆。
外键是为了保证你不能随便删除/插入/修改数据,是数据完整性的一种约束机制。
而表连接是因为一张表的字段无法满足业务需求(你想查的字段来自于2张甚至多张表)
一个是为了增删改,一个是为了查,它俩之间没有联系。
能使用 inner join 就不使用 left join
能使用 left join 就不使用 right join
1.4 模拟Oracle中的full join
上面几个链接查询中
inner是两个表都符合条件的数据
left join 是 左表都有,右表符合条件才有
right join 是 右表都有,左表符合条件才有那么能不能让两个表,别管符合不符合,都有呢?
full join / full outer join ,但是MySQL这里给取消了,比如Oracle就有
模拟一下 full join 的功能
使用 union 获取并集
select * from student s
left join
teacher t on s.teacher_id = t.id
union
select * from student s
right join
teacher t on s.teacher_id = t.id;