聚簇索引和二级索引
每个InnoDB表都有一个称为聚簇索引的特殊索引,其中存储了行的数据。通常聚簇索引与主键同义。要想查询、插入以及数据库的其他操作有最佳的性能,你必须了解InnDB如何利用索引来优化每个表的最常见查找和DML操作。
- 当你在表中定义了主键时,InnoDB使用它作为聚簇索引。为你创建的每个表定义主键。如果没有逻辑唯一且非空的列或者列集,请添加一个自动递增的字段。
- 如果你没有在表中定义主键,那么MySQL会找到第一个所有的列都不为null的唯一索引,InnoDB将使用它作为聚簇索引。
- 如果表中没有定义主键也没有符合条件的索引,InnoDB会在内部通过一个包含行ID的列生成一个名为GEN_CLUST_INDEX的隐藏聚簇索引。索引中的行按照InnoDB分配给每行的id的顺序来排序。行Id是一个大小为6byte的自增字段。因此通过行ID排序也就跟插入顺序是一样的。
聚簇索引的优化原理
通过聚簇索引查询数据是很快的,因为聚簇索引直接指向包含行中所有数据的页面。如果表很大,与使用与索引记录不同的页面存储行数据的存储组织相比,聚簇索引体系结构通常会保存磁盘I / O操作。
二级索引如何使用聚簇索引
除了聚簇索引之外的其他索引统称为二级索引。在InnoDB中,每一个二级索引的一条记录中都保存有主键列以及二级索引指定的列。InnoDB通过主键列利用聚簇索引来查询数据。
如果主键列很长,那么二级索引就需要更多的空间来存储它,所以主键列长度短一点比较好。