MySQL索引入门

介绍

索引就相当于表的目录一样,可以提高我们查询数据的效率,是一种数据结构。常见的MySQL主要有两种结构:Hash索引和B+树索引。使用哪种数据结构跟存储引擎有关,InnoDB引擎默认使用的是B+树。
补充: B+树索引和哈希索引的区别?

  • 哈希索引适合等值查询,B+树索引适合范围查询。
  • 哈希索引无法利用索引完成排序,B+树是一种天然有序的,对范围查询不需要全表查询。
  • 哈希索引不支持联合索引的最左匹配原则。
  • 如果存在大量重复键值,哈希索引效率会很低,因为存在哈希碰撞。

1、索引的选取

  • 1、选择小的数据类型:越小的数据类型通常在磁盘,内存和CPU缓存中占用更少的空间,处理速度更快
  • 2、选择简单的数据类型:整型数据比字符,处理开销更小,因为字符串的比较更复杂
  • 3、尽量避免NULL:在MySQL中,含有空值的列很难进行查询优化,因为空值实的索引,索引的统计信息以及比较运算更加复杂

什么场景不适合使用索引:

  • 1、对于那些在查询中很少使用到的或者参考到的列不适合创建索引:因为很少使用,所以有无索引并不能提高查询速度,相反还需要维护索引和占用空间,得不偿失。
  • 2、对于那些只有很少数据值的列不适合创建索引:比如性别列–只有男女两种,在查询的结果中,结果集的数据行占了表中数据行的很大比例,相当于做全表查询,所以没有必要增加索引,可减少开销。
  • 3、对于那些定义为text、image、和bit类型的列不适合创建索引:因为这些列的数据量要么相当大,要么取值很少。
  • 4、当使用修改的操作远大于查询操作时,不适合创建索引:因为增加索引,虽然可以提高检索速度,但同时也会降低修改性能。
  • 5、对于不会出现在where条件中的字段不适合创建索引:因为你查找的时候都不会用到。
  • 6、对于数据量较小的表不适合创建索引:因为查询速度优化不了多少,相反还会有额外的开销。

什么场景适合使用索引:

  • 1、表的主键,外键必须有索引:默认创建。
  • 2、数据量超过300的表应该创建索引。
  • 3、经常与其他表进行连接的表,在连接字段上应该创建索引,如左连接,右连接。
  • 4、经常出现在where子句中的字段应该创建索引,and使用联合索引,or要确保两个字段都是单列索引。
  • 5、经常用于排序的列应该创建索引,因为索引已经排序。
  • 6、经常用于范围内搜索的列应该创建索引,因为索引已排序,取范围容易。

2、索引的优缺点

优点:

  • 由数据库中的一列或多列组合而成,可以提高对表中数据的查询速度。

缺点:

  • 创建和维护索引需要耗费时间。
  • 索引虽然可以提高查询速度,但也会降低修改性能,因为修改的时候可能会重建索引。一个表的索引最好不要超过6个。
  • 最好先插入数据,再创建索引,速度比先创建索引,再插入数据快,因为

3、索引的分类

1)普通索引:没有任何限制,仅加速查询,是最常用的基本索引。
在已存在的表上创建索引:

CREATE INDEX index_name on healerjean(name);

在创建表的同时创建索引:

create table healerjean (
  id   bigint(20)  NOT NULL AUTO_INCREMENT PRIMARY KEY COMMENT  '主键',
  name  VARCHAR(32) NOT NULL COMMENT '姓名',
  email VARCHAR(64) NOT NULL COMMENT  '邮箱',
  message text DEFAULT  NULL COMMENT '个人信息',
  INDEX index_name (name) COMMENT '索引name'
) COMMENT  = '索引测试表';

注意:如果是blob和text类型的列,必须指定length。

create index ix_ extra on healerjean(message(200));

删除索引:

drop index_name on healerjean;

alter TABLE healerjean drop index index_name;

查看索引:

show index from healerjean;

2)唯一索引:与普通索引不同的 是:加速查询和列值唯一

CREATE UNIQUE INDEX index_mail on healerjean(mail);

3)主索引:主键的索引,与唯一索引的区别就是使用primary关键字,默认创建主键时建立索引

ALTER TABLE healerjean ADD PRIMARY KEY(id);

4)外键索引:也是默认创建外键时建立索引。

5)联合索引:

ALTER TABLE table_name ADD IDNEX index_name ('column1','column2','column3');

遵循最左前缀原则:即最左优先,以最左边的column1为起点的任何连续索引都能匹配上。

  • 本质:当创建联合索引(a,b,c)时,相当于创建了a单列索引,(a,b)联合索引以及(a,b,c)联合索引三个。只用使用这三种组合就可以使索引生效,当然a,c组合也会使索引生效,但其实只用到a的索引,查看key_len可知。
  • 注意: 如果第一个字段是范围查询,需要单独建立一个索引。如 a>4是范围查询,a=3是单值查询。
  • 注意: 联合索引只适合and的条件语句,or条件语句不起作用。
  • 注意: 创建联合索引时,将where子句中使用最频繁的一列放在最左边,遵循最左前缀原则。

6)单列索引:

  • 本质:单独创建三个索引:a,b,c
  • 当查询语句为 where a=2 and b=4 and c=6时:只用到a索引。为什么没有用上b,c另外两个索引呢?
  • 这里就涉及到MySQL优化器的优化策略:当多条件联合查询时,优化器会评估那个条件索引效率最高,就会选择最佳索引去使用,也即abc都能用,只不过优化器判断只需要查询条件的第一个就能完成本次查询,就使用第一个就可以了。
  • 特殊: 当查询语句为 where a=3 or b=4 or c=6时,优化器判断这种情况需要使用到三个索引才是效率最高的,即abc三个索引都要使用。
  • 注意: 无论是否使用到多个索引,多个单列索引都会在底层建立多个B+索引树,比较占用空间,浪费一定的搜索效率,索引当多条件联合查询时最好使用联合索引

参考:链接
7)全文索引:
全文索引(FULLTEXT)仅可以适用于MyISAM引擎的数据表;作用于CHAR,VARCHAR,TEXT数据类型的列。

3、特殊的条件查询

1)对于使用like查询时,后面如果是常量并且只有%号不在第一个字符,索引才可能会被使用到:

  • 不使用:explain select * from company2 where name like ‘%3’;
  • 使用:explain select * from company2 where name like ‘3%’;
    2)如果列名是索引,使用column_name is null 将使用到索引:
explain select * from company2 where name is null;

3)对于大文本进行搜索,使用全文索引而不使用like。

4、存在索引,但不使用

1)MySQL如果估计使用索引比全表搜索更慢,则不使用索引。

  • 如:a均匀分布在1-100,select * from table_name where a>1 and a<90;将不使用a索引。
    2)使用MEMORY/HEAP内存表时,并且where条件不使用 = 进行索引列,则不会使用到索引。heap表只有在 = 的条件下才会使用索引。
  • 补充:内存表使用哈希散列索引把数据保存在内存中,因此具有极快的速度,适合缓存中小型数据库,但是使用上受到一些限制,如服务器重启,内存表数据全丢失,但表结构仍存在;复制某数据表,则复制后的所有主键,索引,自增格式不存在,需要重新添加。
  • 参考:添加链接描述
    3)or条件必须前后所有列都有索引,并且是单列索引,才会被使用到。
    4)如果列是字符型,传入的是数字,则不上‘ ’不会使用索引。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值