了解表连接的人,大概都觉得它很简单。其实简单只是它的外表,如果没有深刻理解Join语句,稍不留神就会有逻辑错误,逻辑错误比语法错误更难发现。
要想正确使用Join语句,有2个知识点是必须掌握的。
第一:SQL语句执行的顺序
- FROM
- JOIN ON
- WHERE
- GROUP BY
- HAVING
- SELECT
- ORDER BY
- FETCH FIRST
第二:ON 和 WHERE 的区别:ON是用来定义连接条件的,WHERE用来过滤结果集
1、FROM ON 连接查询。我们来看一个例子,请看如下表定义:
- CREATE TABLE EMPLOY
- (
- NAME VARCHAR(10),--姓名
- DEPTNO INTEGER--部门编号
- );
- INSERT INTO EMPLOY (NAME, DEPTNO) VALUES
- ('张三',10),
- ('李四',20),
- ('王五',10),
- ('赵红',20);
- CREATE TABLE DEPARTMENT
- (
- DEPTNO INTEGER,--部门编号
- DEPTNAME VARCHAR(10)--部门名
- );
- INSERT INTO DEPARTMENT (DEPTNO, DEPTNAME) VALUES
- (10, '市场部'),
- (20, '技术部');
我们看一条查询语句:
- SELECT * FROM EMPLOY E LEFT JOIN DEPARTMENT D
- ON E.DEPTNO=D.DEPTNO AND D.DEPTNO=40
如果你认为上面这条SQL语句不会返回任何结果的话,说明你还不清楚ON 和 WHERE的区别。再次声明:ON是用来定义连接条件的,而不会过滤结果集。
我们再看一个例子,假设现在让你查询一下所有的员工的姓名和部门名为市场部的部门,怎么查?如下:
- SELECT E.NAME,D.DEPTNAME FROM EMPLOY E LEFT JOIN DEPARTMENT D ON E.DEPTNO=D.DEPTNO
- WHERE D.DEPTNAME='市场部'
如果你也写出上面的语句,那么你就错了,正确的写法应该是这样:
- 方法1:
- SELECT E.NAME,D.DEPTNAME FROM EMPLOY E LEFT JOIN DEPARTMENT D ON E.DEPTNO=D.DEPTNO AND D.DEPTNAME='市场部'
- 方法2:
- SELECT E.NAME,D.DEPTNAME FROM EMPLOY E LEFT JOIN
- (
- SELECT * FROM DEPARTMENT WHERE DEPTNAME='市场部'
- ) AS D
- ON E.DEPTNO=D.DEPTNO
在from join on and 时,应尽量在From 的and中加入筛选条件,看下面一个例子:
- SELECT * FROM A INNER JOIN B ON A.ID=B.ID AND B.ID<>0
- INNER JOIN C ON A.ID=C.ID AND C.ID<>0
- SELECT * FROM A INNER JOIN B ON A.ID=B.ID
- INNER JOIN C ON A.ID=C.ID
- WHERE B.ID<>0 AND C.ID<>0
- --此写法效率比上面写法差,尤其表越多,效果越明显
思考From join on and 连接的的SQL执行顺序。前者两张表JOIN后,马上筛选部分结果在与另一张表JOIN,后者先将三张表JOIN后再筛选,所以很明显前者效率比后者高。
以上只是举了一个简单的例子,其实,使用JOIN的时候,还有好多这样的陷阱,如:在同一个语句中使用Inner Join和Outer Join的时候,应该特别注意。再如:多个表连接的时候,特别要注意连接条件,如:假设A、B、C三个表都有NO字段,以下2个语句可能产生截然不同的结果。
- 语句1:
- A LEFT JOIN B ON A.NO=B.NO
- LEFT JOIN C ON A.NO=C.NO
- 语句2:
- A LEFT JOIN B ON A.NO=B.NO
- LEFT JOIN C ON B.NO=C.NO
2、WHERE 条件连接。先看一个例子:
- SELECT * FROM A, B, C
- WHERE A.ID=B.ID AND A.ID=C.ID AND B.ID<>0 AND C.ID<>0
从逻辑上看,似乎SQL 会先将表JOIN 后再筛选,但实战结果。是先筛选再JOIN !因为SQL SERVER 会内部分析,产生一个最优的执行计划,所以不用你操心,自动帮你处理了!而使用JOIN ON 的话,就好像是使用强制命令,告诉数据库,就是要按你的方式处理结果,数据库只好服从!! 所以思考SQL写法不能只说要效率,同时还要注重结果对了,这才是关键。
两种连接查询各有优缺点,where中sql server会对其进行优化执行顺序,from中可以使用临时表(帅选后的数据)作为连接参照表,这样可以先筛选再连接,减少大数据量的连接。以便可以调高效率。同时结合索引的使用。使用where时,也有缺点,它很容易产生笛卡儿乘积,从而使结果集倍增,既使你指定了正确的连接条件,如果连接条件不唯一,也会产生局部笛卡儿乘积,如果这时使用分组统计,很可能产生不正确的结果,所以,也必须加倍小心。另外,使用from join on可以使表的关系比较清晰,看个人的喜欢吧。