数据库----索引原理

最新推荐文章于 2023-06-09 16:15:52 发布

原创最新推荐文章于 2023-06-09 16:15:52 发布 · 422 阅读

0 ·

CC 4.0 BY-SA版权

数据库专栏收录该内容

9 篇文章

订阅专栏

本文深入探讨了数据库索引的原理，包括为何添加主键可以转换数据表为树状结构，主键如何影响查询速度，以及非聚集索引的工作方式。同时，介绍了覆盖索引的概念，说明在特定情况下，可以通过索引直接获取所需数据，无需经过聚集索引。

解决四个问题，即可理解索引原理，答案都在下文。

为什么要加上主键?
为什么加上索引就会使查询变快？
为什么加上索引后写入、修改、删除就会变慢？
什么情况下同时在两个字段上建立索引？

在某些关系数据库中，如果建表时没有主键，则不允许建表，但有些数据库是允许可以没有主键的，oracle数据库建表就是可以没有主键。无主键、有主键是两种不同的情况。

①、无主键：若一个数据表没有主键，则它的数据无序的放置在磁盘存储器上，一行一行的排列的很整齐，这才是真正的‘表’形式。

②、有主键：若一个数据表加了主键，那么表在磁盘上的存储结构就由整齐的排列结构变成了树状结构（很重要的平衡树）。换句话说，加入了主键，整个表就变成了一个索引。也就是所谓的 “聚集索引”，这也是为什么一个表只能有一个主键，一个表只能有一个 “聚集索引”。

总结：主键的作用就是将 “表” 转换成 “索引（平衡树）”的格式放置。

其中，树中的子节点（除叶子节点外）数据都是由主键字段中的数据构成。也就是通常我们指定主键的id字段。叶子节点才是真正表中的数据。例如：select * from table where id = '12345'

首先根据索引定位到1256这个值所在的叶结点，然后再通过叶结点取到id等于1256的数据行。平衡树的运行过程细节在下文解释。总结就是先用索引找到叶节点，再用叶节点找数据行。树一共有三层，从根节点至叶节点只需要经过三次查找就能得到结果。

第二个例子：如果有一亿条数据，最坏的情况下要匹配一亿次才能完成，即最坏情况 O(n) 才可处理，而且这一亿条数据肯定不能一次性读入内存，想要完成这次查询，个人PC上基本完成不了。而如果将它换成平衡树结构（一棵非常茂盛、子节点非常多的树）。假设这棵树有10层，那么只需要10次IO开销就能查找到所需要的数据，即 O(logn) ，n是记录总树，底数是树的分叉数，结果就是树的层次数。

我们可以发现，查找次数呈指数型下降，利用索引可以使得数据库查询性能提升非常多。

然而，索引有优点也有缺点，我们发现它是平衡树的结构，如果我们增加、删除、修改一些数据，为了保持平衡树的结构，DBMS必须重新梳理树（索引）的结构，这会带来不小的性能开销。总结一下：索引能使数据库查询数据的速度上升，而使写入数据的速度下降，有主键的表就相当于 ‘聚集索引’ ，下面介绍非聚集索引。

非聚集索引：非聚集索引和聚集索引一样，同样是采用平衡树作为索引的数据结构。索引树结构中各节点的值来自于表中的索引字段，假如给user表的name字段加上索引，那么索引就是由name字段中的值构成，在数据改变时， DBMS需要一直维护索引结构的正确性。如果给表中多个字段加上索引，那么就会出现多个独立的索引结构，每个索引（非聚集索引）互相之间不存在关联。