
Elasticsearch
文章平均质量分 77
爱编程的郭小虾要减肥
苦逼程序猿
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
记一次空格导致的分词故障
搜索效果很大程度上依赖于分词器的性能,而开源分词器普遍在电商场景上优化不足,即使是业界先进的中文分词器,例如百度的LAC,Hanlp,在默认词库下,都无法正确分词iphone14promax。因此使用开源分词器,人工对分词结果的干预能力就非常重要了,而经过这次的故障,显然IK在这方面的不足非常明显。原创 2022-09-22 15:28:58 · 567 阅读 · 1 评论 -
Elasticsearch分词调试常用工具
记录一下Elasticsearch分词调试中常用到的API和索引设置原创 2022-09-13 18:18:34 · 817 阅读 · 0 评论 -
Elasticsearch搜索(查询)性能优化
搜索(查询)性能优化为文件系统缓存提供更多内存使用更快的硬件数据预热冷热分离分页查询性能优化文档建模搜索尽可能少的字段预索引数据考虑将标识映射为keyword避免使用脚本搜索四舍五入的日期强制merger只读索引预加载全局序数预加载文件系统缓存使用索引排序来加速关联查询使用preference来优化缓存利用率副本可能有助于提高吞吐量,但并非总是如此为文件系统缓存提供更多内存Elasticsearch 严重依赖文件系统缓存来加快搜索速度。通常,您应该确保至少有一半的可用内存进入文件系统缓存,以便 Elas原创 2021-08-10 21:26:25 · 1501 阅读 · 0 评论 -
Elasticsearch索引(写入)性能优化
索引(写入)性能优化使用bulk请求使用多线程发送数据到Elasticsearch增加刷新(refresh)间隔在初始加载时禁用刷新和副本禁用内存交换(swap)为文件系统缓存提供内存使用自动生成ID使用更快的硬件索引缓冲区的大小禁用_field_names强制合并(merge)Translog设置使用bulk请求批量请求将比单文档索引请求产生更好的性能。为了知道批量请求的最佳大小,您应该在具有单个分片的单个节点上运行基准测试。首先尝试一次索引 100 个文档,然后是 200,然后是 400,等等。在每原创 2021-08-09 20:33:52 · 1446 阅读 · 0 评论