mysql索引详解

最新推荐文章于 2022-11-06 23:16:44 发布

原创最新推荐文章于 2022-11-06 23:16:44 发布 · 223 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#mysql #sql #索引

运维同时被 3 个专栏收录

20 篇文章

订阅专栏

DBA

11 篇文章

订阅专栏

sql

3 篇文章

订阅专栏

索引7问

什么是索引？有什么作用？

索引就相当于一本书的目录，通过目录可以快速的找到对于的资源。
在数据库方面，查询一个表的时候有两种检索方式：

第一种方式：全表扫描
第二种方式：根据索引检索（效率很高）

索引为什么可以提高检索效率呢？

 其实最根本的原理是缩小了扫描的范围。

索引虽然可以提高检索效率，但是不能随意的添加索引，因为索引也是
数据库中的对象，也需要数据库不断的维护。是有维护成本的。比如，表
中的数据经常被修改，这样就不适合添加索引。因为数据一旦被修改，索引
需要重新排序，进行维护。

怎么创建索引？怎么删除索引对象。

   创建索引对象：
   create index 索引名称 on 表名（字段名）;

   删除索引对象：
   drop index 索引名称 on 表名;
   oracle 数据库 中 drop index 索引名称; 也可以使用

什么时候考虑给字段添加索引？（满足什么条件）

数据量庞大（根据具体情况分析）
该字段很少的DML操作。（因为字段进行修改操作，索引也需要维护）
该字段经常出现在where子句中。（经常根据哪个字段查询，就将它放到索引中）

注意：
主键和具有unique约束的字段自动会添加索引。
在数据表查询中，根据主键查询效率较高。尽量根据主键检索。

索引的分类？

单一索引：给单个字段添加索引
复合索引：给多个字段联合起来添加一个索引
主键索引：主键上会自动添加索引
唯一键索引：有unique 约束的字段上会字段添加索引

索引什么时候失效？

模糊查询的时候，第一个通配符使用的是%，这个时候索引会失效
eg：

select ename from emp where ename like "%A%"；

列与列对比

某个表中，有两列（id和c_id）都建了单独索引，下面这种查询条件不会走索引

select * from test where id=c_id;

存在NULL值条件

我们在设计数据库表时，应该尽力避免NULL值出现，如果非要不可避免的要出现NULL值，也要给一个DEFAULT值，数值型可以给0、-1之类的，字符串有时候给空串有问题，就给一个空格或其他。如果索引列是可空的，是不会给其建索引的，索引值是少于表的count(*)值的，所以这种情况下，执行计划自然就去扫描全表了。

select * from test where id is not null;

NOT条件

我们知道建立索引时，给每一个索引列建立一个条目，如果查询条件为等值或范围查询时，索引可以根据查询条件去找对应的条目。反过来当查询条件为非时，索引定位就困难了，执行计划此时可能更倾向于全表扫描，这类的查询条件有：<>、NOT、in、not exists

select * from test where id<>500;
select * from test where id in (1,2,3,4,5);
select * from test where not in (6,7,8,9,0);
select * from test where not exists (select 1 from test_02 where test_02.id=test.id)

LIKE通配符

当使用模糊搜索时，尽量采用后置的通配符，例如：name||’%’，因为走索引时，其会从前去匹配索引列，这时候是可以找到的，如果采用前匹配，那么查索引就会很麻烦，比如查询所有姓张的人，就可以去搜索’张%’。相反如果你查询所有叫‘明’的人，那么只能是%明。这时候索引如何定位呢？前匹配的情况下，执行计划会更倾向于选择全表扫描。后匹配可以走INDEX RANGE SCAN。
所以业务设计的时候，尽量考虑到模糊搜索的问题，要更多的使用后置通配符。

select * from test where name like 张||'%';

条件上包括函数

查询条件上尽量不要对索引列使用函数，比如下面这个SQL

select * from test where upper(name)='SUNYANG';

这样是不会走索引的，因为索引在建立时会和计算后可能不同，无法定位到索引。但如果查询条件不是对索引列进行计算，那么依然可以走索引。比如

select * from test where name=upper('sunyang');
--INDEX RANGE SCAN

这样的函数还有：to_char、to_date、to_number、trunc等

复合索引前导列区分大

当复合索引前导列区分小的时候，我们有INDEX SKIP SCAN，当前导列区分度大，且查后导列的时候，前导列的分裂会非常耗资源，执行计划想，还不如全表扫描来的快，然后就索引失效了。

select * from test where owner='sunyang';

数据类型的转换

当查询条件存在隐式转换时，索引会失效。比如在数据库里id存的number类型，但是在查询时，却用了下面的形式：

select * from sunyang where id='123';

简单描述索引的实现原理？

通过B Tree 缩小扫描范围，底层索引进行了排序，分区，索引会携带数据在表中的"物理地址"，最终通过索引检索到数据之后，获取到关联的物理地址，通过物理地址定位表中的数据，效率是最高的。

 select  ename from emp where ='SMITH'；

通过索引转换为：

  select  ename from emp where ='0x3';

原理解析图

参考文献

索引失效的情况有哪些？索引何时会失效？