MySQL索引分类及创建规则

本文详细介绍了MySQL中各种类型的索引(如普通、唯一、全文、单列/联合索引等),区分了聚簇和非聚簇索引,并提供了创建索引的不同方法。还列举了11种适合添加索引的情况和7种不建议的情况,帮助优化数据库性能。

一、索引的分类

        MySQL的索引包括普通索引、唯一性索引、全文索引、单列索引、多列索引和空间索引等。
        按照功能逻辑 上说,索引主要有 4 种,分别是普通索引、唯一索引、主键索引、全文索引。
        按照 物理实现方式 ,索引可以分为 2 种:聚簇索引和非聚簇索引。
        按照 作用字段个数 进行划分,分成单列索引和联合索引。
小结:不同的存储引擎支持的索引类型也不一样
        InnoDB :支持 B-treeFull-text 等索引,不支持 Hash索引;
        MyISAM : 支持 B-treeFull-text 等索引,不支持 Hash 索引;
        Memory :支持 B-treeHash 等 索引,不支持 Full-text 索引;
        NDB :支持 Hash 索引,不支持 B-treeFull-text 等索引;
        Archive :不支 持 B-treeHashFull-text 等索引;

二、创建索引的方式

1、创建表的时候创建索引

创建表的时候创建索引基本格式如下:

CREATE TABLE table_name [col_name data_type]
[UNIQUE | FULLTEXT | SPATIAL] [INDEX | KEY] [index_name] (col_name [length]) [ASC |
DESC]
UNIQUE FULLTEXT SPATIAL 为可选参数,分别表示唯一索引、全文索引和空间索引;
INDEX KEY 为同义词,两者的作用相同,用来指定创建索引;
index_name 指定索引的名称,为可选参数,如果不指定,那么MySQL默认col_name为索引名;
col_name 为需要创建索引的字段列,该列必须从数据表中定义的多个列中选择;
length 为可选参数,表示索引的长度,只有字符串类型的字段才能指定索引长度;
ASC DESC 指定升序或者降序的索引值存储。
举例:
#创建普通索引
CREATE TABLE book(
    book_id INT ,
    book_name VARCHAR(100),
    authors VARCHAR(100),
    info VARCHAR(100) ,
    comment VARCHAR(100),
    year_publication YEAR,
    INDEX(year_publication)
);

#创建唯一索引
CREATE TABLE test1(
    id INT NOT NULL,
    name varchar(30) NOT NULL,
    UNIQUE INDEX uk_idx_id(id)
);

#创建主键索引
CREATE TABLE student (
    id INT(10) UNSIGNED AUTO_INCREMENT ,
    student_no VARCHAR(200),
    student_name VARCHAR(200),
    PRIMARY KEY(id)
);


#创建单例索引
CREATE TABLE test2(
    id INT NOT NULL,
    name CHAR(50) NULL,
    INDEX single_idx_name(name(20))
);


#创建联合索引
CREATE TABLE test3(
    id INT(11) NOT NULL,
    name CHAR(30) NOT NULL,
    age INT(11) NOT NULL,
    info VARCHAR(255),
    INDEX multi_idx(id,name,age)
);


#创建全文索引
CREATE TABLE test4(
    id INT NOT NULL,
    name CHAR(30) NOT NULL,
    age INT NOT NULL,
    info VARCHAR(255),
    FULLTEXT INDEX futxt_idx_info(info)
) ENGINE=MyISAM;
2、创建表之后创建索引
        在已经存在的表中创建索引可以使用ALTER TABLE语句或者CREATE INDEX语句。
  ①. 使用ALTER TABLE语句创建索引 ALTER TABLE语句创建索引的基本语法如下:
ALTER TABLE table_name ADD [UNIQUE | FULLTEXT | SPATIAL] [INDEX | KEY]
[index_name] (col_name[length],...) [ASC | DESC]

②.使用CREATE INDEX创建索引 CREATE INDEX语句可以在已经存在的表上添加索引,在MySQL中,CREATE INDEX被映射到一个ALTER TABLE语句上,基本语法结构为:

CREATE [UNIQUE | FULLTEXT | SPATIAL] INDEX index_name
ON table_name (col_name[length],...) [ASC | DESC]

三、适合添加索引的11中情况

1.字段数值有唯一性限制

        业务上具有唯一特性的字段,即使是组合字段,也必须建成唯一索引。

2.频繁作为 WHERE 查询条件的字段

        某个字段在SELECT语句WHERE 条件中经常被使用到,那么就需要给这个字段创建索引了。尤其是在 数据量大的情况下,创建普通索引就可以大幅提升数据查询的效率。 比A数据表(含100万条数据),假设我们想要查询A表中id=123110 的用户信息。

3. 经常 GROUP BY ORDER BY 的列

        索引就是让数据按照某种顺序进行存储或检索,因此当我们使用 GROUP BY 对数据进行分组查询,或者使用 ORDER BY 对数据进行排序的时候,就需要对分组或者排序的字段进行索引 。如果待排序的列有多 个,那么可以在这些列上建立组合索引 。

4. UPDATEDELETE WHERE 条件列       

        对数据按照某个条件进行查询后再进行 UPDATE 或 DELETE 的操作,如果对 WHERE 字段创建了索引,就能大幅提升效率。原理是因为我们需要先根据 WHERE 条件列检索出来这条记录,然后再对它进行更新或删除。如果进行更新的时候,更新的字段是非索引字段,提升的效率会更明显,这是因为非索引字段更新不需要对索引进行维护

5.DISTINCT 字段需要创建索引

        有时候我们需要对某个字段进行去重,使用 DISTINCT,那么对这个字段创建索引,也会提升查询效率。这是因为索引会对数据按照某种顺序进行排序,所以在去重的时候也会快很多。

6. 多表 JOIN 连接操作时,创建索引注意事项

        首先, 连接表的数量尽量不要超过 3 张 ,因为每增加一张表就相当于增加了一次嵌套的循环,数量级增长会非常快,严重影响查询的效率。其次, 对 WHERE 条件创建索引 ,因为WHERE 才是对数据条件的过滤。如果在数据量非常大的情况下,没有 WHERE 条件过滤是非常可怕的。 最后, 对用于连接的字段创建索引 ,并且该字段在多张表中的 类型必须一致 。比如 course_id 在 student_info 表和 course 表中都为 int(11) 类型,而不能一个为 int 另一个为 varchar 类型。

7. 使用列的类型小的创建索引

        在数据类型满足字段范围的情况下,使用列的类型小的创建索引,如:TINYINT、SMALLINT、MEDIUMINT、INT、BIGINT,在允许的情况下选择TINYINT。

8. 使用字符串前缀创建索引

在 varchar 字段上建立索引时,必须指定索引长度,没必要对全字段建立索引,根据实际文本

区分度决定索引长度。问题是,截取多少呢?截取得多了,达不到节省索引存储空间的目的;截取得少了,重复内容太多,字段的散列度(选择性)会降低。怎么计算不同的长度的选择性呢?

①先看一下字段在全部数据中的选择度:

select count(distinct 字段名) / count(*) from 表名;

②通过不同长度去计算,与全表的选择性对比:

count(distinct left(列名, 索引长度))/count(*)

注意:如果使用字符串前缀创建索引,就无法使用字符串进行精准查询操作

9. 区分度高(散列性高)的列适合作为索引

        区分度计算公式:select count(distinct 字段名)/count(*) from 表名

10. 使用最频繁的列放到联合索引的左侧

        这样也可以较少的建立一些索引。同时,由于"最左前缀原则",可以增加联合索引的使用率。

11. 在多个字段都要创建索引的情况下,联合索引优于单值索引

四、不适合创建索引的7种情况

1. where中使用不到的字段,不要设置索引

        包括GROUP BY 和ORDER BY中使用不到的字段,都不适合创建索引。

2. 数据量小的表最好不要使用索引

        比如数据量小于1000以下的表,甚至创建索引的时间比查询花费的时间还要多。

3. 有大量重复数据的列上不要建立索引

        举例1:要在 100 万行数据中查找其中的 50 万行(比如性别为男的数据),一旦创建了索引,你需要先 访问 50 万次索引,然后再访问 50 万次数据表,这样加起来的开销比不使用索引可能还要大。

4. 避免对经常更新的表创建过多的索引

        这是因为经常更新的字段创建索引,每次更改字段,都会更新索引,构建B+Tree,对系统消耗会更大,会造成负担。

5. 不建议用无序的值作为索引

        例如身份证、UUID(在索引比较时需要转为ASCII,并且插入时可能造成页分裂)、MD5、HASH、无序长字 符串等。

6. 删除不再使用或者很少使用的索引
7. 不要定义冗余或重复的索引

①、冗余索引:比如联合索引中包含了字段a,那么字段a就不要再创建单列索引了

②、重复索引:给主键索引又创建唯一索引和普通索引

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值