elasticsearch——精确匹配大字段wildcard性能慢问题

博客讲述了分词与查询性能问题及解决办法。起初使用逗号分词+wildcard、keyword字段32766+wildcard,性能都很慢。后发现是wildcard问题,采用match_phrase+standard分词实现精确匹配且效率提高;对于小字段英文、数字的wildcard查询,可用ngram分词器,但字段大时不建议用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

经历

1.使用逗号分词+wildcard,发现性能很慢

2.将内容截断,keyword字段32766+wildcard,发现性能仍然很慢

解决

a.发现是wildcard的问题,但是想实现部分精确匹配,最后使用match_phrase+standard分词,基本能实现精确匹配,而且效率显著提高

参考:http://www.luyixian.cn/news_show_4930.aspx   5.1条

 

b.如果字段很小,并且需要英文,数字的wildcard查询,可以使用ngram分词器,能实现wildcard同样的效果,但是会占用内存,字段太大的建议不使用

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值