MySQL索引入门

最新推荐文章于 2023-07-21 15:12:50 发布

原创最新推荐文章于 2023-07-21 15:12:50 发布 · 138 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#mysql

mysql 专栏收录该内容

19 篇文章

订阅专栏

介绍

索引就相当于表的目录一样，可以提高我们查询数据的效率，是一种数据结构。常见的MySQL主要有两种结构：Hash索引和B+树索引。使用哪种数据结构跟存储引擎有关，InnoDB引擎默认使用的是B+树。
补充： B+树索引和哈希索引的区别？

哈希索引适合等值查询，B+树索引适合范围查询。
哈希索引无法利用索引完成排序，B+树是一种天然有序的，对范围查询不需要全表查询。
哈希索引不支持联合索引的最左匹配原则。
如果存在大量重复键值，哈希索引效率会很低，因为存在哈希碰撞。

1、索引的选取

1、选择小的数据类型：越小的数据类型通常在磁盘，内存和CPU缓存中占用更少的空间，处理速度更快
2、选择简单的数据类型：整型数据比字符，处理开销更小，因为字符串的比较更复杂
3、尽量避免NULL：在MySQL中，含有空值的列很难进行查询优化，因为空值实的索引，索引的统计信息以及比较运算更加复杂

什么场景不适合使用索引：

1、对于那些在查询中很少使用到的或者参考到的列不适合创建索引：因为很少使用，所以有无索引并不能提高查询速度，相反还需要维护索引和占用空间，得不偿失。
2、对于那些只有很少数据值的列不适合创建索引：比如性别列–只有男女两种，在查询的结果中，结果集的数据行占了表中数据行的很大比例，相当于做全表查询，所以没有必要增加索引，可减少开销。
3、对于那些定义为text、image、和bit类型的列不适合创建索引：因为这些列的数据量要么相当大，要么取值很少。
4、当使用修改的操作远大于查询操作时，不适合创建索引：因为增加索引，虽然可以提高检索速度，但同时也会降低修改性能。
5、对于不会出现在where条件中的字段不适合创建索引：因为你查找的时候都不会用到。
6、对于数据量较小的表不适合创建索引：因为查询速度优化不了多少，相反还会有额外的开销。

什么场景适合使用索引：

1、表的主键，外键必须有索引：默认创建。
2、数据量超过300的表应该创建索引。
3、经常与其他表进行连接的表，在连接字段上应该创建索引，如左连接，右连接。
4、经常出现在where子句中的字段应该创建索引，and使用联合索引，or要确保两个字段都是单列索引。
5、经常用于排序的列应该创建索引，因为索引已经排序。
6、经常用于范围内搜索的列应该创建索引，因为索引已排序，取范围容易。

2、索引的优缺点

优点：

由数据库中的一列或多列组合而成，可以提高对表中数据的查询速度。

缺点：

创建和维护索引需要耗费时间。
索引虽然可以提高查询速度，但也会降低修改性能，因为修改的时候可能会重建索引。一个表的索引最好不要超过6个。
最好先插入数据，再创建索引，速度比先创建索引，再插入数据快，因为

3、索引的分类

1）普通索引：没有任何限制，仅加速查询，是最常用的基本索引。
在已存在的表上创建索引：

CREATE INDEX index_name on healerjean(name);

在创建表的同时创建索引：

create table healerjean (
  id   bigint(20)  NOT NULL AUTO_INCREMENT PRIMARY KEY COMMENT  '主键',
  name  VARCHAR(32) NOT NULL COMMENT '姓名',
  email VARCHAR(64) NOT NULL COMMENT  '邮箱',
  message text DEFAULT  NULL COMMENT '个人信息',
  INDEX index_name (name) COMMENT '索引name'
) COMMENT  = '索引测试表';

注意：如果是blob和text类型的列，必须指定length。

create index ix_ extra on healerjean(message(200));

删除索引：

drop index_name on healerjean;

alter TABLE healerjean drop index index_name;

查看索引：

show index from healerjean;

2）唯一索引：与普通索引不同的是：加速查询和列值唯一

CREATE UNIQUE INDEX index_mail on healerjean(mail);

3）主索引：主键的索引，与唯一索引的区别就是使用primary关键字，默认创建主键时建立索引

ALTER TABLE healerjean ADD PRIMARY KEY(id);

4）外键索引：也是默认创建外键时建立索引。

5）联合索引：

ALTER TABLE table_name ADD IDNEX index_name ('column1','column2','column3');

遵循最左前缀原则：即最左优先，以最左边的column1为起点的任何连续索引都能匹配上。

本质：当创建联合索引(a,b,c)时，相当于创建了a单列索引，(a,b)联合索引以及(a,b,c)联合索引三个。只用使用这三种组合就可以使索引生效，当然a,c组合也会使索引生效，但其实只用到a的索引，查看key_len可知。
注意： 如果第一个字段是范围查询，需要单独建立一个索引。如 a>4是范围查询，a=3是单值查询。
注意： 联合索引只适合and的条件语句，or条件语句不起作用。
注意： 创建联合索引时，将where子句中使用最频繁的一列放在最左边，遵循最左前缀原则。

6）单列索引：

本质：单独创建三个索引：a，b，c
当查询语句为 where a=2 and b=4 and c=6时：只用到a索引。为什么没有用上b，c另外两个索引呢？
这里就涉及到MySQL优化器的优化策略：当多条件联合查询时，优化器会评估那个条件索引效率最高，就会选择最佳索引去使用，也即abc都能用，只不过优化器判断只需要查询条件的第一个就能完成本次查询，就使用第一个就可以了。
特殊： 当查询语句为 where a=3 or b=4 or c=6时，优化器判断这种情况需要使用到三个索引才是效率最高的，即abc三个索引都要使用。
注意： 无论是否使用到多个索引，多个单列索引都会在底层建立多个B+索引树，比较占用空间，浪费一定的搜索效率，索引当多条件联合查询时最好使用联合索引。

参考：链接
7）全文索引：
全文索引（FULLTEXT)仅可以适用于MyISAM引擎的数据表；作用于CHAR,VARCHAR,TEXT数据类型的列。

3、特殊的条件查询

1）对于使用like查询时，后面如果是常量并且只有%号不在第一个字符，索引才可能会被使用到：

不使用：explain select * from company2 where name like ‘%3’；
使用：explain select * from company2 where name like ‘3%’；
2）如果列名是索引，使用column_name is null 将使用到索引：

explain select * from company2 where name is null;

3）对于大文本进行搜索，使用全文索引而不使用like。

4、存在索引，但不使用

1）MySQL如果估计使用索引比全表搜索更慢，则不使用索引。

如：a均匀分布在1-100，select * from table_name where a>1 and a<90;将不使用a索引。
2）使用MEMORY/HEAP内存表时，并且where条件不使用 = 进行索引列，则不会使用到索引。heap表只有在 = 的条件下才会使用索引。
补充：内存表使用哈希散列索引把数据保存在内存中，因此具有极快的速度，适合缓存中小型数据库，但是使用上受到一些限制，如服务器重启，内存表数据全丢失，但表结构仍存在；复制某数据表，则复制后的所有主键，索引，自增格式不存在，需要重新添加。
参考：添加链接描述
3）or条件必须前后所有列都有索引，并且是单列索引，才会被使用到。
4）如果列是字符型，传入的是数字，则不上‘ ’不会使用索引。