一种优化mysql select like %%的方法

本文介绍了一种通过修改MySQL配置并结合自定义分词模块来提高LIKE查询效率的方法,利用全文索引显著提升了搜索速度。

问题:mysql like %XXX%使得数据库引擎不能使用索引,而导致select查询缓慢。200M的表select like需要1s左右,这是实时性要求高的服务器承受不了的。

解决方法:首先google一通发现,都在说like很难优化,一般都是采用开源插件分词+全文索引。然后再搜索,又搜索到了clucene,研究了下clucene,发现用它的人都是重新实现的分词模块,这样如果不实现中文分词模块,clucene的作用也不大。如果搜索的字符串长度不大的话,比如是搜索文章标题,那么自己来实现分词模块也不是很难。下面的方法就是针对这类需求而实现的。

基本原理是:把mysql配置文件中的ft_min_word_len=3改为1。(没有这项就直接添加),然后新建一个字段来保持分词结果,给这个字段建立全文索引。然后实现一个分词模块,把词语“大家好”拆分为“大 大家 大家好 家 家好 好”。然后用match .. against 来代替like %%,查询出来的结果跟like的结果基本相同(如果分词合理的话),但是效率比like高至少10倍以上。

具体实现见http://www.xiaoyatou.net/gitweb/?p=libyt.git;a=blob;f=luaTest/SplitWords.h;h=8d10daf10484b48d0534547ec15c295d82de2a79;hb=HEAD

http://www.xiaoyatou.net/gitweb/?p=libyt.git;a=blob;f=luaTest/SplitWords.cpp;h=b3cfe13b8952eda7819bf012779e10e9ff45a12c

<think>嗯,用户想优化 MySQL 中 where like '%111%' 这样的查询。这类查询确实很常见但性能往往不好,因为前导通配符会让索引失效。 用户引用了三条资料:第一条提到 OR 条件优化索引失效问题,第二条解释 % 通配符的匹配规则,第三条提到用 union 优化多个 like 查询。这些引用很有价值,特别是 union 方案值得重点考虑。 用户可能正在处理模糊搜索功能,比如商品搜索或日志查询,数据量应该不小,不然不会关注性能优化。ta 的提问很精准,说明已经意识到前导通配符是痛点。 首先得明确核心瓶颈:B树索引无法匹配'%xxx'这种模式。不过还是有几种思路: 1. 如果允许的话,把前导通配符去掉变成'111%',这样就能用上索引了。不过用户需求明确要求双百分号,这条路可能行不通。 2. 考虑全文索引方案,但需要表引擎是 InnoDB 且 MySQL 5.6+版本。这个方案最优雅但可能有版本限制。 3. 用 union 拆分查询,像引用[3]说的那样,不过要拆成'111%'和'%111'两部分。虽然后半段还是扫表,但前半段能用索引,整体性能提升明显。 4. 引入专用搜索引擎,不过对用户来说可能太重了。 另外注意到引用[1]提到 OR 条件优化,虽然不能直接解决 like 问题,但提醒了避免在 where 子句混用 or 和 like,这点要补充说明。 用户应该需要立即见效的方案,所以得优先推荐 union 技巧和全文索引。如果数据量特别大,再考虑额外提醒搜索引擎方案。优化器提示之类的进阶技巧可能用户暂时用不上,简单提一句即可。 最后要强调:所有优化都要配合 explain 验证,毕竟实际效果取决于数据分布。 </think>针对 `WHERE LIKE '%111%'` 这类**前导通配符导致索引失效**的查询优化,以下是系统性的解决方案: --- ### 一、核心优化方案 1. **强制使用全文索引(最优解)** ```sql -- 创建全文索引(需InnoDB/MyISAM表) ALTER TABLE 表名 ADD FULLTEXT INDEX idx_name (字段名); -- 使用MATCH AGAINST代替LIKE(注意保留原LIKE条件防精度丢失) SELECT * FROM 表名 WHERE MATCH(字段名) AGAINST('111' IN BOOLEAN MODE) AND 字段名 LIKE '%111%'; ``` *✅ 原理*:全文索引支持单词级检索,规避前导通配符限制[^1]。需注意: - MySQL 5.6+ 支持InnoDB全文索引 - 中文需配置ngram分词(`ngram_token_size=2`) 2. **反向索引+前缀查询(适合固定后缀)** ```sql -- 新增反转字段并建索引 ALTER TABLE 表名 ADD COLUMN reverse_name VARCHAR(255) AS (REVERSE(字段名)) STORED; CREATE INDEX idx_reverse ON 表名 (reverse_name); -- 查询转换(111结尾 → 111反转后开头) SELECT * FROM 表名 WHERE reverse_name LIKE REVERSE('111') + '%'; -- 实际传参:'111%'反转→'%111' ``` *✅ 适用场景*:已知后缀(如手机尾号、证件号末位) --- ### 二、辅助优化技巧 1. **拆分UNION查询(引用[3]方案增强)** ```sql (SELECT * FROM 表名 WHERE 字段名 LIKE '111%') -- 前缀命中索引 UNION ALL (SELECT * FROM 表名 WHERE 字段名 LIKE '%111' AND 字段名 NOT LIKE '111%') -- 避免重复 ``` *⚠️ 注意*:需确保前缀查询过滤掉大部分数据 2. **覆盖索引减少IO** ```sql CREATE INDEX idx_covering ON 表名 (字段名, id, 其他查询字段); ``` *✅ 效果*:二级索引树覆盖查询列,避免回表[^1] --- ### 三、架构级解决方案 | 方案 | 适用场景 | 优势 | |---------------------|-----------------------------------|----------------------| | Elasticsearch/Solr | 高频模糊检索(日志/商品搜索) | 毫秒级响应,分词优化 | | 生成列+表达式索引 | MySQL 8.0+ | 原生支持函数索引 | | 查询缓存 | 静态数据 | 避免重复计算 | --- ### 四、优化黄金原则 1. **严禁混合OR条件** ```sql -- 错误写法(引用[1]警示) SELECT * FROM users WHERE name LIKE '%abc%' OR email LIKE '%abc%'; -- 双字段索引失效 -- 正确改写 SELECT * FROM users WHERE name LIKE '%abc%' UNION ALL SELECT * FROM users WHERE email LIKE '%abc%' AND name NOT LIKE '%abc%'; ``` 2. **实时验证执行计划** ```sql EXPLAIN SELECT ... -- 检查type列避免"ALL"(全表扫描) ``` - 目标扫描类型:`index` > `range` > `ref` 3. **控制结果集大小** ```sql LIMIT 100 -- 强制终止大数据量扫描 ``` > **最终建议**: > 中小数据量 → 采用 **全文索引** + **覆盖索引** > 大数据量高并发 → **Elasticsearch** 专业搜索方案 --- ### 相关问题 1. 全文索引对中文分词的支持如何配置? 2. 如何在MySQL 8.0中创建函数索引? 3. Elasticsearch与MySQL数据实时同步有哪些方案? 4. 联合索引中字段顺序对模糊查询有何影响? [^1]: OR条件优化索引失效警告 [^2]: 百分号通配符匹配规则 [^3]: UNION拆分查询策略
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值