从写入原理深入elasticsearch写入优化

深入剖析Elasticsearch的写入原理与优化策略

1、线上实际遇到的问题剖析

在实际的线上业务场景中,Elasticsearch的写入操作常常会面临各种各样的挑战。以下是一些具有代表性的问题:

  1. 数据插入延迟波动问题:有这样的需求,即每分钟通过sparksteaming向按天划分的索引中插入150万条数据。索引配置为7个分片,1个副本。在大多数情况下,1分钟内插入150万条数据可以正常完成。然而,偶尔会出现严重的延迟,原本1分钟能完成的插入操作,可能突然需要5分钟才能成功,之后又恢复正常。即便将副本设置为0,并且把批量插入的参数从5000提升到2万,使用12个16g的节点,情况依然没有明显改善。
  2. 分词器导致的数据写入缓慢问题:由于使用了多个分词器,数据写入速度明显变慢,急需找到有效的优化方法来提升写入效率。
  3. 日志收集链路的性能瓶颈问题:在日志收集链路kafka-logstash-es中,压力测试显示logstash的输出速度为70M/s,而Elasticsearch的索引写入速度却不到一半。这种性能损失的原因是什么,又该如何进行调优呢?

以上这些问题只是众多实际问题中的一部分,类似的情况在实际应用中还有很多。

2、问题的综合分析

上述三个问题虽然各有特点,但本质上都是在不同数据源向Elasticsearch写入数据的过程中产生的。可以将这些问题归纳为Elasticsear

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

少林码僧

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值