Elasticsearch 调优场景

最新推荐文章于 2025-03-27 22:57:08 发布

程序员JavaWind

最新推荐文章于 2025-03-27 22:57:08 发布

阅读量409

点赞数 10

文章标签： elasticsearch 大数据搜索引擎

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_40587144/article/details/138144308

版权

文章介绍了在ES集群中，针对13个节点、20+索引、大量数据的场景，通过日期模板创建索引、批量写入、禁用部分查询特性以及部署优化等手段进行索引层面的调优，以提高性能和存储效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

背景： ES 集群架构 13 个节点，索引根据通道不同共 20+索引，根据日期，每日递增 20+，索引：10 分片，每日递增 1 亿+数据，每个通道每天索引大小控制：150GB 之内。

仅索引层面调优手段：

1：设计阶段调优

根据业务增量需求，采取基于日期模板创建索引，通过 roll over API 滚动索引；
使用别名进行索引管理；
每天凌晨定时对索引做 force_merge 操作，以释放空间；
采取冷热分离机制，热数据存储到 SSD，提高检索效率；冷数据定期进行 shrink操作，以缩减存储；
采取 curator 进行索引的生命周期管理；
仅针对需要分词的字段，合理的设置分词器；
Mapping 阶段充分结合各个字段的属性，是否需要检索、是否需要存储等。………

2：写入调优

写入前副本数设置为 0；
写入前关闭 refresh_interval 设置为-1，禁用刷新机制；
写入过程中：采取 bulk 批量写入；
写入后恢复副本数和刷新间隔；
尽量使用自动生成的 id。

3：查询调优

禁用 wildcard；
禁用批量 terms（成百上千的场景）；
充分利用倒排索引机制，能 keyword 类型尽量 keyword；
数据量大时候，可以先基于时间敲定索引再检索；
设置合理的路由机制。

4：其他调优

部署调优，业务调优等。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

程序员JavaWind 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。