引言
在使用 Easysearch 时,如何在存储和查询性能之间找到平衡是一个常见的挑战。Easysearch 具备多种压缩模式,各有千秋。本文将重点探讨一种特别的压缩模式:zstd + source_reuse,我们最近重新优化了 source_reuse,使得它在吞吐量和存储效率方面都表现出色。
测试概览
测试条件选用了 esrally 工具和 geonames 数据集来进行压力测试。数据集包含了 11396503 条记录,往单个 shard 写入,对以下几种压缩模式进行压测对比:
-
default -
best_compression -
zstd -
zstd + source_reuse
下图是对 CPU 的监控,可以看到各个模式对 CPU 的使用是基本相近的。
default

best_compression

zstd

本文详细比较了Easysearch中的zstd+source_reuse压缩模式,通过压力测试发现它在存储效率和查询性能上表现出色,尤其在geonames数据集上,压缩效率提升且不影响吞吐量,推荐在存储成本敏感的场景中使用。
最低0.47元/天 解锁文章
824

被折叠的 条评论
为什么被折叠?



