关于in和exists的使用
1.当父查询结果集小于子查询结果集则选择exists,如果父查询结果集大于子查询结果集选择in。(可尝试等价改写)
in和exists都有子查询优化,提升子查询,有时候这两的执行计划一样。需要注意的是如果子查询包含了父查询里面的条件,in不会被优化。
2.in里面的值一般不超过100个
3.单表postgresql的in和个数关系不大,都可以走索引。
4.当有连表并且有in的个数很多,count的时候需要解析这些值很慢,所以可以封装成any valuse的形式来求count,而分页还是使用in。此例主要是in和any(values)的等价改写
any values:c_bh=any(values(‘53’),(‘530001’),(‘530002’),…)
postgresql在查询的时候会自动做表连接。将两张表做hash join操作:
1.EXPLAIN SELECT * FROM X WHERE x_num IN(SELECT y_num FROM y);
2. QUERY PLAN
3.----------------------------------------------------------------------
4. Hash Join (cost=23.25…49.88 rows=350 width=86)
5. Hash Cond: (x.x_num = y.y_num)
6. -> Seq Scan on x (cost=0.00…17.00 rows=700 width=86)
7. -> Hash (cost=20.75…20.75 rows=200 width=4)
8. -> HashAggregate (cost=18.75…20.75 rows=200 width=4)
-> Seq Scan on y (cost=0.00…17.00 rows=700 width=4)
关于not in和not exists的使用
1.建议使用not exists,不使用not in
2.not in不能提升子查询
3.当not in中包含null值时,无结果集
like条件无索引
1.前,后模糊匹配,都需要建立索引,防止大量的全表扫描。
2.全模糊匹配程序上可以控制输入的字符个数,防止全表扫描,返回大量数据。
对join,left join的使用,将条件放到on和where后面的区别问题
postgresql中left join中将条件放入 on和where的区别。
1.on是肯定会返回左表的数据,所以在on里面的条件都会返回,如果想要过滤数据则需要在where中加条件
2.由于 inner join是两表都有的,所以,返回的结果是和where条件一样的。
示例:
select * form tab1 left join tab2 on (tab1.size = tab2.size) where tab2.name=’AAA’
select * form tab1 left join tab2 on (tab1.size = tab2.size and tab2.name=’AAA’)