首先,我们来看一下简单的查找,我们首先想到的是全盘扫描,但是在这种方法下,效率是很低的。
这个时候,我们发现在页(mysql管理储存空间的基本单位)的七个组成部分中
(file helper:用来记录页的上下文,
page helper:数据也的储存状态,比如一共有多少条数据,槽,第一条的地址是什么,
infinum +supernum:用来存储两条虚拟记录,最大记录和最小记录:
user resource:真实数据储存位置,
free space:页面还没有使用到的地方,是将来的user resource,
page directory:大小不确定,是页面的槽的数量,当插入的数值越多,占用的空间越多,是记录的相对位置。
file trailer:用来检验当从磁盘读取信息到内存是信息是否完整。)
槽可以用来对信息的查找,进行二分查找,但是只能是通过主键进行,因为在页中,记录是会安装主键来进行排序来储存的。
当记录非常多的时候,页的数量也非常多,我们需要建立目录,目录的内容应该包括当前页的最小的记录和页的号码,但是我们应该怎么存储目录呢????
我们想到页存储记录和目录存储页的格式是一样的,所以我们通过想数据页一样储存目录。值得一提的是,这个目录也就是我们通常所说的索引。
因为目录符合b+树
(键值从小到大排列,这包括三个方面
1.页内的记录主键从小到大排列
2.存储记录的页也要根据页中记录的主键大小进行一个双向链表
3.储存目录的页也要根据页中记录的主键大小进行一个双向链表
叶子节点包括所有信息
)模式,所以我们可以通过二分查找,满足这两个特性的b+书叫做聚簇索引
这个时候问题来了,当我们要查询其他列,没有排序的时候怎么办,这个时候我们会创建一个新的B+树,但是这个B+树不是聚簇索引,而是二级索引,特性和聚簇索引的差别有
(叶子节点没有包含全部的信息,只有查询列和主键
使用查询列进行排序
目录项不再是主键+页号,而是查询列+页号
)
当我们需要查询多列的时候,就是联合查询(叶子节点由查询列和页号组成,排序先按第一列排,当第一列相同时再按第二列排,以此类推。)
**
参考
**