【Java八股面试系列】数据库(总结市面所有数据库知识点)

最新推荐文章于 2025-04-15 10:37:48 发布

原创

最新推荐文章于 2025-04-15 10:37:48 发布 · 1k 阅读

30 ·

CC 4.0 BY-SA版权

文章标签：

#数据库 #java #面试 #spring boot #mybatis #spring #maven

本文围绕MySQL数据库展开，详细介绍了索引的概念、聚簇与非聚簇索引特点、实现方式及优劣，还阐述了事务的特性、并发问题与隔离级别，锁的分类与算法，Mvcc原理，Redo和Undo日志，以及InnoDB和MyISAM存储引擎的差异等信息技术相关内容。

文章目录

索引

索引是什么

官方介绍索引是帮助MySQL高效获取数据的数据结构。更通俗的说，数据库索引好比是一本书前面的目录，能加快数据库的查询速度。

聚簇&非聚簇索引

聚簇索引（主索引）

聚簇索引也叫聚集索引或者主索引，它并不是一种单独的索引类型，而是一种数据存储方式。在聚簇索引中，数据行的物理存储顺序与索引顺序相同，即数据是按照索引键的顺序存储的。聚簇索引的叶子节点保存了一行记录的所有列信息，也就是说，叶子节点中包含了一个完整的记录行。

聚簇索引的自动创建

在MySQL中，如果使用InnoDB存储引擎，当表定义主键时，InnoDB会自动为该主键创建聚簇索引。这是因为InnoDB表总是按照主键进行排序存储的，这种索引就是聚簇索引。

聚簇索引的特点是存储数据的顺序和索引顺序一致，且一个表只能有一个聚簇索引。在InnoDB中，如果没有显式定义主键，但表中存在唯一非空索引，则InnoDB会将其选作聚簇索引。如果连这样的唯一非空索引也不存在，InnoDB会自动生成一个隐藏的、包含6字节长度的聚簇索引，用于优化某些操作。

特点

聚簇索引是将数据放在了叶子节点，找到索引也就是找到了数据。由于是按照创造索引的字段进行排序，所以进行范围查询时非常的高效。但是每一个表只能有一个聚簇索引，如果频繁的插入或者删除数据，可能导致数据页的频繁分裂和合并。

非聚簇索引(辅助索引)

非聚簇索引也叫辅助索引、普通索引。非聚簇索引的叶子节点只包含聚簇索引的键（或指向聚簇索引的指针），而不包含完整的记录行。因此，通过非聚簇索引查找记录时，需要先找到主键，然后再通过主键到聚簇索引中找到对应的记录行，这个过程被称为回表。

特点

非聚簇索引可以有多个

非聚簇索引是分开存储的，所以适合更新或者插入数据的场景。因为更新时候只需要更新索引而不需要移动数据。

范围查询的效率较低，需要回表查询，所以效率较低

索引的实现方式

Hash

Hash是一种基于Hash函数实现的数据结构，底层原理包括了以下三个方面：

哈希函数（Hash Function）： 哈希函数是哈希表的核心，它接受一个键作为输入，并输出该键对应的哈希值。哈希函数应该具有以下特性：
- 对于相同的键，哈希函数应该始终返回相同的哈希值。
- 哈希函数应该尽可能均匀地将不同的键映射到不同的哈希值，以减少哈希冲突的发生。
- 哈希函数的计算速度应该尽可能快，以保证高效的插入和查找操作。
哈希表数组（Array）： 哈希表通常由一个数组来存储数据。数组的每个元素称为一个桶（Bucket），每个桶可以存储一个或多个键值对。哈希表的长度通常是固定的，但也可以根据需要进行动态扩容。
解决哈希冲突： 由于不同的键可能映射到数组中的同一个位置，可能会发生哈希冲突。常见的解决哈希冲突的方法包括：
- 链地址法（Separate Chaining）：在哈希表的每个桶中维护一个链表或者其他数据结构（如红黑树），用于存储发生哈希冲突的键值对。
- 开放地址法（Open Addressing）：在发生哈希冲突时，线性地探查哈希表的其他位置，直到找到一个空闲的位置来存储键值对。常见的探查方法包括线性探查、二次探查、双重哈希等。
哈希表的装载因子（Load Factor）： 哈希表的装载因子是指哈希表中已存储的键值对数目与哈希表长度之比。装载因子的大小会影响哈希表的性能，通常会根据装载因子的阈值进行动态扩容或者收缩，以保持哈希表的性能。