数据库性能优化1——正确建立索引以及最左前缀原则

1. 索引建立的原则

用于索引的最好的备选数据列是那些出现在WHERE子句、join子句、ORDER BY或GROUP BY子句中的列。

仅仅出现在SELECT关键字后面的输出数据列列表中的数据列不是很好的备选列

SELECT
col_a <- 不是备选列
FROM
tbl1 LEFT JOIN tbl2
ON tbl1.col_b = tbl2.col_c <- 备选列
WHERE
col_d = expr; <- 备选列

当然,显示的数据列与WHERE子句中使用的数据列也可能相同。
我们的观点是输出列表中的数据列本质上不是用于索引的很好的备选列。


2. 复合索引的建立以及最左前缀原则

索引字符串值的前缀(prefixe)。如果你需要索引一个字符串数据列,那么最好在任何适当的情况下都应该指定前缀长度。
例如,如果有CHAR(200)数据列,如果前面10个或20个字符都不同,就不要索引整个数据列。
索引前面10个或20个字符会节省大量的空间
你可以索引CHAR、VARCHAR、BINARY、VARBINARY、BLOB和TEXT数据列的前缀。


假设你在表的state、city和zip数据列上建立了复合索引。索引中的数据行按照state/city/zip次序排列,
因此它们也会自动地按照state/city和state次序排列。这意味着,即使你在查询中只指定了state值,
或者指定state和city值,MySQL也可以使用这个索引。因此,这个索引可以被用于搜索如下所示的数据列组合:
state, city, zip
state, city
state

MySQL不能利用这个索引来搜索没有包含在最左前缀的内容。例如,如果你按照city或zip来搜索,
就不会使用到这个索引。如果你搜索给定的state和具体的ZIP代码(索引的1和3列),
该索引也是不能用于这种组合值的,尽管MySQL可以利用索引来查找匹配的state从而缩小搜索的范围。

如果你考虑给已经索引过的表添加索引,那么就要考虑你将增加的索引是否是已有的多列索引的最左前缀。
如果是这样的,不用增加索引,因为已经有了(例如,如果你在state、city和zip上建立了索引,那么没有必要再增加state的索引)。

3. 实例分析

通过实例理解单列索引、多列索引以及最左前缀原则
实例:现在我们想查出满足以下条件的用户id:
mysql>SELECT `uid` FROM people WHERE lname`='Liu'  AND `fname`='Zhiqun' AND `age`=26
因为我们不想扫描整表,故考虑用索引。

单列索引:
ALTER TABLE people ADD INDEX lname (lname);
将lname列建索引,这样就把范围限制在lname='Liu'的结果集1上,之后扫描结果集1,产生满足fname='Zhiqun'的结果集2,再扫描结果集2,找到 age=26的结果集3,即最终结果。

由于建立了lname列的索引,与执行表的完全扫描相比,效率提高了很多,但我们要求扫描的记录数量仍旧远远超过了实际所需 要的。虽然我们可以删除lname列上的索引,再创建fname或者age 列的索引,但是,不论在哪个列上创建索引搜索效率仍旧相似。

多列索引:
ALTER TABLE people ADD INDEX lname_fname_age (lame,fname,age);
为了提高搜索效率,我们需要考虑运用多列索引,由于索引文件以B-Tree格式保存,所以我们不用扫描任何记录,即可得到最终结果。

注:在mysql中执行查询时,只能使用一个索引,如果我们在lname,fname,age上分别建索引,执行查询时,只能使用一个索引,mysql会选择一个最严格(获得结果集记录数最少)的索引。


3.最左前缀:顾名思义,就是最左优先,上例中我们创建了lname_fname_age多列索引,相当于创建了(lname)单列索引,(lname,fname)组合索引以及(lname,fname,age)组合索引。


注:在创建多列索引时,要根据业务需求,where子句中使用最频繁的一列放在最左边。
### MySQL索引最左前缀匹配原理 在MySQL中,当创建复合索引(也称为联合索引),例如 `(a, b, c)` 时,查询优化器利用这些列的方式依赖于所谓的“最左前缀原则。这意味着如果有一个由多个字段组成的索引,则只有从左边开始连续的部分可以被用于加速检索操作[^1]。 具体来说,在执行查询语句期间: - 如果仅涉及第一个字段 `a` 的条件过滤,那么整个多列索引都能发挥作用; - 当同时存在针对 `a` 和 `b` 字段的约束时,同样能够充分利用此组合键来提高效率; - 对于包含所有三个字段 (`a`, `b`, `c`) 的筛选表达式而言,自然也能享受到最佳性能增益; 然而需要注意的是,一旦中间某个位置上的属性缺失了相应的限定条件——比如只提供了关于 `b` 或者 `c` 的值而忽略了前面更靠左的位置上定义好的那些项——则后续右边剩余部分便不再适用于当前这条记录集的选择过程之中。 因此为了确保数据库引擎尽可能高效地运用已建立起来的各种形式的数据结构来进行快速定位目标数据行的操作,设计表结构以及编写SQL语句的时候应当充分考虑到这一点,并据此合理规划各个业务逻辑所对应的访问路径。 ```sql -- 正确使用最左前缀的例子 SELECT * FROM table_name WHERE a = 'value' AND b = 'value'; -- 错误使用最左前缀的例子 SELECT * FROM table_name WHERE b = 'value'; ``` #### 使用场景 对于需要频繁按照某些特定模式进行范围扫描或者精确查找的应用场合特别适合采用基于最左前缀特性的索引来提升整体读取效能。这包括但不限于以下几种情况: - 经常依据某几个固定顺序排列的关键字做为输入参数参与联接运算或是子查询内部作为参照对象的情况。 - 需要支持复杂条件下带有多种不同维度限制因子的同时作用下的统计分析需求。 - 场景涉及到大量时间序列型资料处理任务时,通过构建适当的时间戳与其他辅助信息相结合形成的有序列表可以帮助加快历史版本回溯等功能实现的速度。
评论 6
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值