14.MySQL --- 索引存储结构B+树

radient-lsr

于 2023-10-03 20:01:44 发布

阅读量91

点赞数

分类专栏： MySQL 文章标签： mysql b树数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_73302761/article/details/133527279

版权

MySQL 专栏收录该内容

25 篇文章

订阅专栏

索引概念的引入

在这里插入图片描述

简单的索引设计

我们在根据某个搜索条件查找一些记录时，为什么要遍历所有的数据页？

因为各个页中的记录没有规律，我们并不知道我们的搜索条件匹配哪些页中的记录，所以不得不依次遍历所有的数据页。

所以如果我们想快速定位到需要查找到记录在哪些数据页中该怎么办？

我们可以为快速定位记录所在的数据页单独建立一个目录，建这个目录必须完成下边这些事：

下一个数据页中，用户记录的主键值必须大于上一个页中用户记录的主键值
给所有的页建立一个目录项

在这里插入图片描述

索引的存储结构 — B+树

我们存入数据库的数据都是一行一行存的，那么这些数据被保存到数据库后，在数据库加载到缓冲池的时候是怎么加载的？

是按页加载的，一行行数据加载到一页页里面，也就是说我们的索引数据都是放在一页一页里面的，而一页的大小是16kb，

一个表中的数据就会有好多好多页，接着上面索引概念的引入，其实我们MySQL的InnoDB索引底层创建的索引结构是B+树

目录页保存的是所保存的数据页的主键值的最小值和数据页的页数

目录页的目录页保存的是目录页的主键值的最小值和目录页的页数

迭代一次

在这里插入图片描述

当数据页增多后，一个目录页已经不足以放得下那么多数据页的目录的时候，就会再开辟一个目录页保存数据页数据

在这里插入图片描述

我们注意到目录页一多，也会出现查找可能需要O(n)的情况，这个时候就需要我们的目录页的目录页

在这里插入图片描述

B+树底层是怎么生成的

InnoDB中的B+树是通过递归的方式生成的，从根节点开始，逐层生成叶子节点。

生成B+树的过程中，首先会生成目录页，然后再生成数据页。

生成B+树的步骤如下：

创建根节点：首先创建一个空的根节点，并给其分配一个页号。根节点是一个目录页。
生成目录页：从根节点开始生成目录页。目录页包含指针，指向下一层的页节点，这些指针可以跳过一定数量的数据页，以提高检索效率。
生成数据页：在叶子层生成数据页，每个数据页存储了具体的数据记录。数据页是叶子节点。
递归生成树：通过递归的方式，在每个目录页上生成下一层的目录页和数据页，直到达到B+树的要求。

需要注意的是，InnoDB中的B+树是自平衡的，当插入或删除数据时，会自动重新调整树结构，以保持树的平衡性和性能。同时，InnoDB也会利用缓冲池来提高B+树的访问速度，将经常被访问的页放入缓冲池中。

B+树能存多少数据

这里我们先假设B+树高为2，即存在一个根节点和若干个叶子节点，那么这棵B+树的存放总记录数为：根节点指针数*单个叶子节点记录行数。

上文我们已经说明单个叶子节点（页）中的记录数=16K/1K=16。（这里假设一行记录的数据大小为1k，实际上现在很多互联网业务数据记录大小通常就是1K左右）。

那么现在我们需要计算出非叶子节点能存放多少指针？

其实这也很好算，我们假设主键ID为bigint类型，长度为8字节，而指针大小在InnoDB源码中设置为6字节，这样一共14字节，我们一个页中能存放多少这样的单元，其实就代表有多少指针，即16384/14=1170。那么可以算出一棵高度为2的B+树，能存放1170*16=18720条这样的数据记录。

根据同样的原理我们可以算出一个高度为3的B+树可以存放：1170*1170*16=21902400条这样的记录。

所以在InnoDB中B+树高度一般为1-3层，它就能满足千万级的数据存储。在查找数据时一次页的查找代表一次IO，所以通过主键索引查询通常只需要1-3次IO操作即可查找到数据。

总结：单表存储的数据其实根本存不到千万级别，因为一旦数据超过500万条数据，就要开始考虑分库分表了，所以B+树完全够用

博客等级

码龄3年

103
原创

11
点赞

30
收藏

5
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

线程的创建方式及自定义线程池
优快云-Ada助手: 恭喜您开始博客创作！标题非常吸引人，线程的创建方式及自定义线程池是一个很有深度的话题。在您的博客中，您可以详细介绍不同的线程创建方式，并探讨每种方式适用的场景和优缺点。同时，您可以分享一些实际应用中的案例，帮助读者更好地理解和应用这些知识。期待您在下一篇博客中能进一步展开，给出一些自己的实践经验和建议，这将使您的博客更加丰富和具有实用价值。加油！推荐【每天值得看】：https://bbs.youkuaiyun.com/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
Synchronized锁大全
优快云-Ada助手: 恭喜您写了第三篇博客！标题为“Synchronized锁大全”真是让人期待。您的文章内容一定非常丰富和详实，对于Synchronized锁的理解也一定非常深入。希望您能继续保持创作的热情，并且分享更多关于多线程编程的知识。下一步，如果可能的话，可以考虑探讨一些其他类型的锁，例如ReentrantLock等，并分享一些实践经验和案例分析。期待您的下一篇博客！优快云正在通过评论红包奖励优秀博客，请看红包流：https://bbs.youkuaiyun.com/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
项目搭建---Redis
优快云-Ada助手: 恭喜您写了第11篇博客！标题“项目搭建---Redis”听起来非常有趣。您的持续创作精神值得赞扬！在下一步的创作中，或许您可以考虑介绍一些关于Redis的实际应用案例，或者分享一些在项目搭建过程中遇到的挑战和解决方法。期待您的下一篇博客！再次恭喜您的努力！
项目搭建---ElasticSearch
优快云-Ada助手: 恭喜您写了第12篇博客《项目搭建---ElasticSearch》！您的持续创作令人钦佩，不断分享知识和经验对读者来说是一种福音。在这篇博客中，您向我们介绍了ElasticSearch的项目搭建过程，让读者能够更好地了解和应用该技术。对于下一步的创作建议，我谨虚心地提出一些建议。首先，您可以考虑进一步深入探讨ElasticSearch的高级用法和最佳实践，以帮助读者更加全面地理解和应用该技术。其次，您可以分享一些实际项目中遇到的挑战和解决方案，这将使您的博客更加具有实战价值，吸引更多读者的关注。再次恭喜您的持续创作，期待您未来更多精彩的博客分享！
项目搭建---操作数据库
优快云-Ada助手: 恭喜您的第13篇博客！看到您在标题中提到了项目搭建和操作数据库，我非常期待了解更多关于这个话题的内容。您的持续创作让读者受益匪浅，感谢您的分享！在下一篇博客中，如果您能够介绍一下如何优化数据库查询性能或者分享一些实际案例以及解决方案，那将会非常有帮助。再次感谢您的辛勤努力，期待您的下一篇精彩博文！

大家在看

27. 右值引用和左值引用

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。