索引的数据结构与优缺点

1、索引的数据结构
什么是索引?
索引就是mysql为了提高查询数据的一种数据结构。在数据之外,数据库系统还维护着满足特定查找算法
的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找
算法,这种数据结构就是索引
在这里插入图片描述
2、索引的优缺点
(1)优点
1) 类似于书籍的目录索引,提高数据检索的效率,降低数据库的I0成本。
2)通过索弓|列对数据进行排序,降低数据排序的成本,降低CPU的消耗。
(2)缺点
1) 实际上索引也是一张表,该表中保存了主键与索引字段,并指向表的记录,所以索弓|列也是要占
用空间的。
2)虽然索引大大提高了查询效率,同时却也降低更新表的速度,如对表进行INSERT、UPDATE、
DELETE。因为更新表时,MySQL不仅要保存数据,还要保存一下索引文件每次更新添加了 索引列的
字段,都会调整因为更新所带来的键值变化后的索引信息。
3、索引的数据结构是什么?
大多数采用B+TREE树,少数使用Hash表。

了解B-(B)TREE
B树是一种多路平衡查找树,它的每一个节点最多包含k个孩子,k 被称为B树的阶。k的大小取决于磁盘页的大小。
下面来具体介绍一下B- 树(Balance Tree) ,一个m阶的B树具有如下几个特征: .
1.根结点至少有两个子女。
2.每个中间节点都包含k- 1个元素和k个孩子,其中m/2 <= k <= m
3.每一个叶子节点都包含k-1个元素,其中m/2 <= k <= m
4.所有的叶子结点都位于同一层。
5.每个节点中的元素从小到大排列,节点当中k- 1个元素正好是k个孩子包含的元素的值域分划。

带有卫星数据的B-树(图摘自知乎程序员小灰)

总结:二叉树每个节点只存储一一个元素,而BTree每个节点可以存储k-1个元素。而k的取值取决于阶的
个数。[m/2<=k<=m] .由于Btree每个节点中存储的元素个数更多,导致了相同元素经过IO的次数更
少,从而效率更高了。

然后是B+树
一个m阶的B+树具有如下几个特征:
1.有k个子树的中间节点包含有k个元素(B树中是k-1个元素),每个元素不保存数据,只用来索
引,所有数据都保存在叶子节点。
2.所有的叶子结点中包含了全部元素的信息,及指向含这些元素记录的指针,且叶子结点本身依关
键字的大小自小而大顺序链接。
3.所有的中间节点元素都同时存在于子节点,在子节点元素中是最大(或最小)元素。
帶有衛星數據的B+樹(图摘自知乎程序员小灰)

B树和B+树有两点不同。首先,B+ 树的中间节点没有卫星数据,所以同样大小的磁盘页可以容纳更多的节点元素。其次,B+ 树的查询必须最终查找到叶子节点,而B-树只要找到匹配元素即可,无论匹配元素处于中间节点还是叶子节点。因此,B-树的查找性能并不稳定(最好情况是只查根节点,最坏情况是查到叶子节点)。而B+树的每一次查找都是稳定的。
综合起来,B+树相比B-树的优势有三个:

  1. I0次数更少;
  2. 查询性能稳定;
  3. 范围查询简便。

卫星数据的存储:
数据库的聚集索引(Clustered Index)中,叶子节点直接包含卫星数据。
在非聚集索引(NonClustered Index)中,叶子节点带有指向卫星数据的指针。

4、索引的分类

  1. 单列索引:即一个索引只包含单个列,一个表可以有多个单列索引
  2. 唯一索引:索引列的值必须唯一, 但允许有空值,[primary unique]
  3. 复合索引:即一个索引包含多个列

5、如何创建索引

create index 索引名 on 表名
show index from 表名
drop index 索引名 on 表名

6、创建索引的原则
●对查询频次较高,且数据量比较大的表建立索引。
●索引字段的选择,最佳候选列应当从where子句的条件中提取。
●使用唯一 索引,区分度越高,使用索引|的效率越高。身份证手机号账号。
●索引可以有效的提升查询数据的效率,但索引数量不是多多益善,索引越多,维护索引的代价自然也就水涨船高。对于插入、更新、删除等DML操作比较频繁的表来说,索引过多,会引入相当高的维护代价,降低DML操作的效率,增加相应操作的时间消耗。另外索引过多的话,MySQL也会犯选择困难病,虽然最终仍然会找到一个可用的索引,但无疑提高了选择的代价。
●使用短索引,索引创建之后也是使用硬盘来存储的,因此提升索引|访问的I/O效率,也可以提升总体的访问效率。假如构成索引的字段总长度比较短,那么在给定大小的存储块内可以存储更多的索引值,相应的可以有效的提升MySQL访问索引的I/O效率。
●利用最左前缀法则,N个列组合而成的组合索引,那么相当于是创建了N个索引,如果查询时
where子句中使用了组成该索引的前几个字段,那么这条查询SQL可以利用组合索引来提升查询效
率。

7、存储过程
存储过程和函数是事先经过编译并存储在数据库中的一段SQL语句的集合,调用存储过程和函数
可以简化应用开发人员的很多工作,减少数据在数据库和应用服务器之间的传输,对于提高数据
处理的效率是有好处的。
存储过程和函数的区别在于函数必须有返回值,而存储过程没有。
函数:是一个有返回值的过程;
过程:是一个没有返回值的函数;

### 聚合索引单列索引优缺点对比 #### 1. **聚合索引的优点** - 聚合索引(Clustered Index)定义了数据在物理存储上的顺序,通常用于主键或其他唯一标识符字段。由于其直接决定了表中数据的实际排列方式,因此对于范围查询排序操作具有天然的优势。 - 对于范围查找(Range Queries),如 `WHERE column BETWEEN value1 AND value2` 或者涉及有序性的操作(如 `ORDER BY` `GROUP BY`),聚合索引能够显著减少磁盘 I/O 操作,从而提升性能[^1]。 - 查询结果可以直接从索引中获取,无需回表访问实际的数据行,这被称为覆盖索引的效果。 #### 2. **聚合索引的缺点** - 表中只能有一个聚合索引,因为它控制着数据的物理存储顺序。这意味着其他需要频繁使用的列无法再享受这种优化效果[^5]。 - 插入新记录或更新现有记录时可能引发页分裂(Page Split)。当新的记录插入到中间位置或者已有记录被修改导致超出页面容量时,数据库引擎不得不重新分配空间并调整相邻页面的内容,增加了额外开销。 - 如果删除大量数据,则可能导致碎片化现象严重,影响整体读取效率。 #### 3. **单列索引的优点** - 单列索引适用于那些单独使用频率较高的字段上设置独立索引来加速特定类型的查询请求。例如,在某些业务场景下某个非主键属性经常作为过滤条件参 SQL 执行计划制定过程,则为其建立专门针对该字段设计的标准 B-tree 结构形式 的辅助性检索机制就显得尤为重要了[^2]。 - 创建简单快捷,并且不会改变原有表格内部布局安排模式;即使存在多个不同方向的需求也可以分别设立各自对应的版本以满足多样化应用场景下的高效运作需求[^4]。 #### 4. **单列索引的缺点** - 当遇到复杂查询语句中含有多种组合逻辑运算符以及跨多张关联表之间相互参照定位目标对象实例的时候,仅仅依靠单一维度构建起来的传统意义上的次级目录体系往往难以胜任全部任务要求,此时就需要考虑引入更加高级别的解决方案比如复合型联合体或者是全文搜索引擎插件等功能扩展模块来弥补单纯依赖普通版别所带来的局限性不足之处。 - 过度创建过多数量级别的此类附加设施反而会造成反向抑制效应——不仅占用更多宝贵的硬件资源配额而且还会拖慢日常事务处理流程的速度表现水平下降明显。 ```sql -- 示例:创建单列索引 CREATE INDEX idx_single_column ON table_name(column_name); -- 示例:创建聚簇索引 (假设为主键) ALTER TABLE table_name ADD PRIMARY KEY (column_name); ``` #### 总结 选择合适的索引类型取决于具体的应用场景、工作负载特征以及长期维护成本考量等因素综合评估之后才能得出最佳实践方案建议列表如下所示: | 特性 | 聚合索引 | 单列索引 | |--------------------|-----------------------------------------------------------------------------------------------|-------------------------------------------------------------------------------------------| | 数据存储顺序 | 控制数据的物理存储顺序 | 不影响数据的物理存储 | | 更新/插入代价 | 可能因页分裂而导致较高代价 | 较低,除非触发大规模重平衡 | | 查询性能 | 高效支持范围查询及覆盖索引 | 更灵活适应多样化的查询需求 | | 维护难度 | 修改结构较为困难 | 易于管理调整 | --- ###
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值