索引笔记

本文分享了11条SQL性能优化的实用建议,包括避免负向条件查询、合理使用索引、选择合适的数据类型等,帮助开发者提升数据库查询效率。
(1)负向条件查询不能使用索引
select * from order where status!=0 and stauts!=1
not in/not exists都不是好习惯

可以优化为in查询:
select * from order where status in(2,3)
 
(2)前导模糊查询不能使用索引
select * from order where desc like '%XX'
而非前导模糊查询则可以:
select * from order where desc like 'XX%'
 
(3)数据区分度不大的字段不宜使用索引
select * from user where sex=1
原因:性别只有男,女,每次过滤掉的数据很少,不宜使用索引。

经验上,能过滤80%数据时就可以使用索引。对于订单状态,如果状态值很少,不宜使用索引,如果状态值很多,能够过滤大量数据,则应该建立索引。
select * from dba_tab_col_statistics where table_name='';--可查询统计信息NUM_DISTINCT字段做重复度参考
 
(4)在属性上进行计算不能命中索引
select * from order where YEAR(date) < = '2017'
即使date上建立了索引,也会全表扫描,可优化为值计算:
select * from order where date < = CURDATE()
或者:
select * from order where date < = '2017-01-01'
 
(5)如果业务大部分是单条查询,使用Hash索引性能更好,例如用户中心
select * from user where uid=?
select * from user where login_name=?
原因:
B-Tree索引的时间复杂度是O(log(n))
Hash索引的时间复杂度是O(1)
 
(6)允许为null的列,查询有潜在大坑
单列索引不存null值,复合索引不存全为null的值,如果列允许为null,可能会得到“不符合预期”的结果集
select * from user where name != 'shenjian'
如果name允许为null,索引不存储null值,结果集中不会包含这些记录。
所以,请使用not null约束以及默认值。
 
(7)复合索引最左前缀,并不是指SQL语句的where顺序要和复合索引一致
用户中心建立了(login_name, passwd)的复合索引
select * from user where login_name=? and passwd=?
select * from user where passwd=? and login_name=?
都能够命中索引

select * from user where login_name=?
也能命中索引,满足复合索引最左前缀
select * from user where passwd=?
不能命中索引,不满足复合索引最左前缀
 
(8)使用ENUM而不是字符串
ENUM保存的是TINYINT,别在枚举中搞一些“中国”“北京”“技术部”这样的字符串,字符串空间又大,效率又低。
 
(9)如果明确知道只有一条结果返回,limit 1能够提高效率
select * from user where login_name=?
可以优化为:
select * from user where login_name=? limit 1
原因:
你知道只有一条结果,但数据库并不知道,明确告诉它,让它主动停止游标移动
 
(10)把计算放到业务层而不是数据库层,除了节省数据的CPU,还有意想不到的查询缓存优化效果
select * from order where date < = CURDATE()
这不是一个好的SQL实践,应该优化为:
$curDate = date('Y-m-d');
$res = mysql_query(
    'select * from order where date < = $curDate');
原因:
释放了数据库的CPU
多次调用,传入的SQL相同,才可以利用查询缓存
 
(11)强制类型转换会全表扫描
select * from user where phone=13800001234
你以为会命中phone索引么?大错特错了,这个语句究竟要怎么改?
 
末了,再加一条,
外键索引并不能提示SQL查询性能,而是为了约束数据,保证相关联的业务数据一致性。
### MySQL 索引使用教程 #### 一、索引概述 索引是对数据库表中一列或多列的值进行排序的一种结构,用于快速高效地获取数据。MySQL 支持多种类型的索引,其中最常用的是 B+Tree 索引。 - **B+Tree 索引**:这是最常见的索引类型,在大多数情况下提供良好的性能。它适用于范围查询和精确匹配查询[^1]。 ```sql CREATE INDEX idx_column ON table_name (column); ``` #### 二、常见索引种类 ##### 覆盖索引 当查询所需的数据全部可以在索引中找到而无需访问实际表格时称为覆盖索引。这能显著减少 I/O 操作次数从而提升效率。 ##### 复合索引 由多个字段组成的联合索引被称为复合索引。创建这样的索引有助于加速涉及多列条件组合的复杂查询语句执行速度。需要注意构建复合索引时应考虑各字段的选择性和查询频率来决定先后顺序[^2]。 ```sql CREATE INDEX idx_composite ON table_name (col1, col2); ``` #### 三、回表现象解释 如果一次查询操作既利用到了索引来定位记录位置又不得不回到原始表去读取其他未被索引包含的信息,则会发生所谓的“回表”。为了降低这种情况的发生概率,建议尽可能设计合理的单列或复合索引以实现完全覆盖所要检索的内容项。 --- ### 注意事项 - **选择合适字段作为索引** - 应优先选取那些经常出现在 WHERE 子句中的高基数(即不同值较多)属性建立索引;对于低基数属性则没有必要设置索引因为反而会增加存储开销并拖累写入性能。 - **避免不必要的重复索引** - 定期审查现有索引配置情况去除不再需要或是功能重叠的部分防止浪费资源影响整体表现。 - **关注索引顺序的影响** - 对于复合索引而言其内部各个组成部分之间的排列次序至关重要——通常应当把过滤力度最强的那个放在前面以便尽早缩小搜索空间加快处理进度。 - **控制好索引数量** - 尽管适当添加一些辅助性的索引确实有利于改善某些特定模式下的响应时间但是过量堆积同样会造成负面影响所以务必权衡利弊做出明智决策。 - **特殊条件下索引失效的情况** - 当 `WHERE` 条件中含有不等于 (`!=`) 这样的比较运算符时可能会导致原本有效的索引变得不可用进而退化成全表扫描的方式来进行遍历查找工作[^3]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值