SQL索引与优化技巧-优快云博客

本文链接：https://blog.youkuaiyun.com/qq_36687977/article/details/121412195

java集合类：

sql优化：（oracle）
索引失效的原因：
（没有where语句；使用is null或is not null；where语句中使用函数或不等于操作>=；使用like进行模糊查询；等于和范围索引不会合并使用；数据类型不匹配进行比较）
如何修复索引失效：
但是如果是同样的sql如果在之前能够使用到索引，那么现在使用不到索引，以下几种主要情况:索引失效的原因
1. 随着表的增长，where条件出来的数据太多，大于15%，使得索引失效（会导致CBO计算走索引花费大于走全表）
2. 统计信息失效需要重新搜集统计信息
3. 索引本身失效需要重建索引-- ‍alter index 索引名 rebuild 【online】
强制使用索引
sql优化的常用注意事项：
使用索引（复合索引总是使用索引的第一列），
索引列不进行计算；使用exists，not exists 来代替in，not in，DISTINCT；用UNION替换OR (适用于索引列) ；避免使用索引列的类型进行比较（隐式转换不会使用索引）.
使用经验：
通过时间进行表分区，提高检索效率

oracle分页查询：
	SELECT * FROM 
		(
		SELECT A.*, ROWNUM RN 
		FROM (SELECT * FROM TABLE_NAME) A 
		WHERE ROWNUM <= 40
		)
		WHERE RN > 21
mysql分页查询：
	select * from emp limit 5,10


mysql索引：
	**
	单列索引(普通索引，唯一索引，主键索引)、组合索引、全文索引、空间索引

	（1）单列索引：一个索引只包含单个列，但一个表中可以有多个单列索引。

	（2）普通索引：MySQL中基本索引类型，没有什么限制，允许在定义索引的列中插入重复值和空值，纯粹为了查询数据更快一点。

	（3）唯一索引：索引列中的值必须是唯一的，但是允许为空值。

	（4）主键索引：是一种特殊的唯一索引，不允许有空值。

	（5）组合索引：在表中的多个字段组合上创建的索引，只有在查询条件中使用了这些字段的左边字段时，索引才会被使用，使用组合索引时遵循最左前缀集合。

	（6）全文索引，只有在MyISAM引擎上才能使用，只能CHAR,VARCHAR,TEXT类型字段上使用全文索引，介绍了要求，说说什么是全文索引，就是在一堆文字中，通过其中的某个关键字等，就能找到该字段所属的记录行，比如有"你是个小可爱，二货 …" 通过小可爱，可能就可以找到该条记录。主要针对模糊查询
	（7）空间索引：空间索引是对空间数据类型的字段建立的索引，MySQL中的空间数据类型有四种，GEOMETRY、POINT、LINESTRING、POLYGON。在创建空间索引时，使用SPATIAL关键字。要求，引擎为MyISAM，创建空间索引的列，必须将其声明为NOT NULL。

oracle索引：
	**
	唯一索引，组合索引，反向键索引，位图索引，基于函数的索引
	（1）唯一索引： 唯一索引确保在定义索引的列中没有重复值， Oracle 自动在表的主键列上创建唯一索引
	语法：create unique index index_name on table_name (column_name);
	具体列值： 索引相关列上的值必须唯一，但可以不限制NULL值。
	（2）组合索引： 组合索引是在表的多个列上创建的索引，索引中列的顺序是任意的， 如果 SQL 语句的 WHERE 子句中引用了组合索引的所有列或大多数列，则可以提高检索速度
	语法：create index index_name on table_name (column_name1，column_name2);
	具体列值：该表中的元组由两列共同确定一行，例如班级号 学号 唯一确定一个学生。
	（3）反向键索引：
	反向键索引反转索引列键值的每个字节，为了实现索引的均匀分配，避免b树不平衡，通常建立在值是连续增长的列上，使数据均匀地分布在整个索引上，创建索引时使用REVERSE关键字
	语法：create index index_name on table_name (column_name) reverse;
	具体列值： 适用于某列值前面相同，后几位不同的情况，例如
	sno：        1001 1002 1003 1004 1005 1006 1007
	索引转化：1001 2001 3001 4001 5001 6001 7001
	（4）位图索引：
	位图索引适合创建在低基数列上
	位图索引不直接存储ROWID，而是存储字节位到ROWID的映射
	节省空间占用
	如果索引列被经常更新的话，不适合建立位图索引
	总体来说，位图索引适合于数据仓库中，不适合OLTP中
	语法：create bitmap index index_name on table_name (column_name);
	具体列值： 不适用于经常更新的列，适用于条目多但取值类别少的列，例如性别列。
	（5）基于函数的索引：
	基于一个或多个列上的函数或表达式创建的索引
	表达式中不能出现聚合函数
	不能在LOB类型的列上创建



sql优化：
1.SQL语句尽量用大写的

因为oracle总是先解析SQL语句，把小写的字母转换成大写的再执行。

2.使用表的别名

当在SQL语句中连接多个表时, 尽量使用表的别名并把别名前缀于每个列上。这样一来,就可以减少解析的时间并减少那些由列歧义引起的语法错误。

3.选择最有效率的表名顺序(只在基于规则的优化器中有效)-----工作中有用到可以举例使用

ORACLE 的解析器按照从右到左的顺序处理FROM子句中的表名，FROM子句中写在最后的表(基础表也称为驱动表,driving table)将被最先处理，在FROM子句中包含多个表的情况下,必须选择记录条数最少的表作为基础表。如果有3个以上的表连接查询, 那就需要选择交叉表(intersection table)作为基础表, 交叉表是指那个被其他表所引用的表。
例如下面的两个语句：

--No.1  tableA 100w条记录  tableB 1w条记录 执行速度 十秒级
SELECT COUNT(*) FROM tableA,tableB;

--No.2  执行速度百秒级甚至更高
SELECT COUNT(*) FROM tableB,tableA; 
 

上面的结果肯定是No.2比No.1效率更高

SELSETCOUNT(1) FROM tableA a,tableB b ,tableC c WHERE a.id=b.id AND a.id=c.id;
 

上面的sql中tableA 就称为交叉表，根据oracle对From子句从右向左的扫描方式，应该把交叉表放在最末尾，然后才是最小表，所以上面的应该这样写

--tableA a 交叉表 
--tabelB b 100w
--tableC c 1w
SELECT COUNT(1) FROM tableB b ,tableC c ,tableA a WHERE a.id=b.id AND a.id=c.id;
 

这种写法对大数据量会非常有用，大家谨记，也是很常用的。

18.用索引提高效率（没有where语句；使用is null或is not null；where语句中使用函数或不等于操作>=；使用like进行模糊查询；等于和范围索引不会合并使用；数据类型不匹配进行比较）
	1. 没有 WHERE 子句
	2. 使用 IS NULL 和 IS NOT NULL
	SELECT ... FROM emp WHERE comm IS NULL; comm 列的索引会失效
	3. WHERE 子句中使用函数
	如果没有使用基于函数的索引，那么 where 子句中对存在索引的列使用函数时，会使优化器忽略掉这些索引。例如：
	select * from staff where trunc(birthdate) = '01-MAY-82';
	但是把函数应用在条件上，索引是可以生效的，把上面的语句改成下面的语句，就可以通过索引进行查找。
	select * from staff where birthdate < (to_date('01-MAY-82') + 0.9999);
	from_unixtime(create_time) = ’2014-05-29’就不能使用到索引，原因很简单，
	b+树中存的都是数据表中的字段值
	但进行检索时，需要把所有元素都应用函数才能比较，显然成本太大。所以语句应该写成create_time = unix_timestamp(’2014-05-29’);
	注意：对于 MIN, MAX 函数，Oracle 仍然使用索引。
	4. 使用 LIKE ‘%T’ 进行模糊查询
	5. WHERE 子句中使用不等于操作
	不等于操作包括：<>, !=, NOT colum >= ?, NOT colum <= ?
	对于这个限制条件可以通过 OR 替代，例如： colum <> 0  ===>   colum>0 OR colum<0
	6. 等于和范围索引不会被合并使用
	SELECT emp_id, emp_m, salary_q ... FROM emp WHERE job='manager' AND deptno>10
	job 和 deptno 都是非唯一索引，这种条件下 oracle 不会合并索引，它只会使用第一个索引。
	7. 比较不匹配数据类型
	dept_id是一个varchar2型的字段，在这个字段上有索引，但是下面的语句会执行全表扫描。
	select * from dept where dept_id = 900198;
	这是因为 oracle 会自动把 where 子句转换成 to_number(dept_id)=900198，相当于使用函数，这样就限制了索引的使用。正确写法如下：
	select * from dept where dept_id = '900198';
13.不要用in，not in，用exists，not exists 来代替
通常情况下采用exists要比in效率高，因为IN不走索引。
14.用Where子句替换HAVING子句
避免使用HAVING子句, HAVING 只会在检索出所有记录之后才对结果集进行过滤. 这个处理需要排序,总计等操作。
19.用EXISTS替换DISTINCT

　　当提交一个包含一对多表信息(比如部门表和雇员表)的查询时,避免在SELECT子句中使用DISTINCT. 一般可以考虑用EXIST替换, EXISTS 使查询更为迅速,因为RDBMS核心模块将在子查询的条件一旦满足后,立刻返回结果. 例子

--(低效): 
SELECT  DISTINCT  DEPT_NO,DEPT_NAME  FROM  DEPT D , EMP E 
WHERE  D.DEPT_NO = E.DEPT_NO 
--(高效): 
SELECT  DEPT_NO,DEPT_NAME  FROM  DEPT D  WHERE  EXISTS ( SELECT ‘X’ 
FROM  EMP E  WHERE E.DEPT_NO = D.DEPT_NO);

21.通常避免在索引列上使用NOT或进行计算

我们要避免在索引列上使用NOT, NOT会产生在和在索引列上使用函数相同的影响. 当ORACLE”遇到”NOT,他就会停止使用索引转而执行全表扫描。
　　
24.用UNION替换OR (适用于索引列)

　　通常情况下, 用UNION替换WHERE子句中的OR将会起到较好的效果. 对索引列使用OR将造成全表扫描. 注意, 以上规则只针对多个索引列有效. 如果有column没有被索引, 查询效率可能会因为你没有选择OR而降低. 在下面的例子中, LOC_ID 和REGION上都建有索引。

复制代码
--高效: 
SELECT LOC_ID , LOC_DESC , REGION 
FROM LOCATION 
WHERE LOC_ID = 10 
UNION 
SELECT LOC_ID , LOC_DESC , REGION 
FROM LOCATION 
WHERE REGION = “MELBOURNE” 
--低效: 
SELECT LOC_ID , LOC_DESC , REGION 
FROM LOCATION 
WHERE LOC_ID = 10 OR REGION = “MELBOURNE” 

26.总是使用索引的第一个列

如果索引是建立在多个列上, 只有在它的第一个列(leading column)被where子句引用时,优化器才会选择使用该索引. 这也是一条简单而重要的规则，当仅引用索引的第二个列时,优化器使用了全表扫描而忽略了索引。