探究分片副本数量等条件对ElasticSearch批量数据插入的影响

ElasticSearch批量插入性能测试与优化
本文通过详尽的测试,分析了ElasticSearch中分片副本数量、文档结构、存储设备类型等因素对批量数据插入速度的影响。测试表明,副本存在显著降低批量提交性能,固态硬盘和更多的分片能提升效率。最佳实践建议使用5个分片、无副本、SSD存储和异步提交。

目录

测试内容

两套环境的配置

对于简单文档的测试

对于嵌套文档的测试

TransportClient客户端

多种测试方案综合比较

测试结论

关于分片和副本


做出该测试的是公司的一位大佬,所以其实是转载

测试内容

分别在不同的环境下,测试不同的文档结构,分片和副本数量对于插入速率的影响。

第二次指的是删除索引后重建索引的测试结果。

两套环境的配置

1. A机8核20G内存4T机械硬盘,B机赛扬2核6G内存500G机械硬盘,C机笔记本12核16G内存1T机械硬盘;

2. 笔记本3个虚拟机2核2G内存+SSD磁盘。

对于简单文档的测试

一. 在机械硬盘上

  • 1个分片0个副本,400条平均用时829毫秒,4千万预计用时23小时。
  • 1个分片2个副本,400条平均用时2067毫秒,4千万预计用时57小时。
  • 2个分片0个副本,400条平均用时852毫秒,4千万预计用时23.6小时。
  • 3个分片0个副本,400条平均用时756毫秒,4千万预计用时21小时。(40000个文档基本大小548M)
  • 3个分片0个副本,400条平均用时716毫秒,4千万预计用时21小时。(第二次)
  • 3个分片1个副本,400条平均用时1196毫秒,4千万预计用时33小时。
  • 4个分片0个副本,400条平均用时972毫秒,4千万预计用时27小时。
  • 4个分片0个副本,400条平均用时701毫秒,4千万预计用时19.47小时。(第二次)
  • 5个分片0个副本,400条平均用时707毫秒,4千万预计用时19.63小时。
  • 5个分片0个副本,400条平均用时618毫秒,4千
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值