redis切片集群：数据增多了，是该加内存还是加实例？

Redis切片集群：应对数据量增长的高效策略

最新推荐文章于 2022-09-28 15:22:29 发布

韩淼燃

最新推荐文章于 2022-09-28 15:22:29 发布

阅读量324

点赞数

CC 4.0 BY-SA版权

分类专栏：从入门到精通的Redis 文章标签：切片集群

本文链接：https://blog.youkuaiyun.com/weixin_36691991/article/details/120870391

从入门到精通的Redis 专栏收录该内容

36 篇文章 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

本文探讨了如何在Redis中处理大量数据，比较了纵向扩展（增加内存）和横向扩展（切片集群）的优缺点。重点介绍了Redis切片集群的工作原理，包括数据切片、实例分布、客户端数据定位。通过哈希槽实现数据和实例的映射，并解释了客户端如何应对实例和哈希槽变化的重定向机制。

我曾遇到过这么一个需求：要用Redis保存5000万个键值对，每个键值对大约是512B，为了能快速部署并对外提供服务，我们采用云主机来运行Redis实例，那么，该如何选择云主机的内存容量呢？

我粗略地计算了一下，这些键值对所占的内存空间大约是25GB（5000万*512B）。所以，当时，我想到的第一个方案就是：选择一台32GB内存的云主机来部署Redis。因为32GB的内存能保存所有数据，而且还留有7GB，可以保证系统的正常运行。同时，我还采用RDB对数据做持久化，以确保Redis实例故障后，还能从RDB恢复数据。

但是，在使用的过程中，我发现，Redis的响应有时会非常慢。后来，我们使用INFO命令查看Redis的latest_fork_usec指标值（表示最近一次fork的耗时），结果显示这个指标值特别高，快到秒级别了。

这跟Redis的持久化机制有关系。在使用RDB进行持久化时，Redis会fork子进程来完成，fork操作的用时和Redis的数据量是正相关的，而fork在执行时会阻塞主线程。数据量越大，fork操作造成的主线程阻塞的时间越长。所以，在使用RDB对25GB的数据进行持久化时，数据量较大，后台运行的子进程在fork创建时阻塞了主线程，于是就导致Redis响应变慢了。

看来，第一个方案显然是不可行的，我们必须要寻找其他的方案。这个时候，我们注意到了Redis的切片集群。虽然组建切片集群比较麻烦，但是它可以保存大量数据，而且对Redis主线程的阻塞影响较小。

切片集群，也叫分片集群，就是指启动多个Redis实例组成一个集群，然后按照一定的规则，把收到的数据划分成多份，每一份用一个实例来保存。回到我们刚刚的场景中，如果把25GB的数据平均分成5份（当然，也可以不做均分），使用