阿里大厂面试：2亿条数据需要缓存，如何设计这个存储方案？

最新推荐文章于 2024-11-19 21:52:42 发布

互联网老辛

最新推荐文章于 2024-11-19 21:52:42 发布

阅读量7k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：运维面试宝典文章标签：价值观个人成长 docker

本文为互联网老辛原创文章，未经博主允许不得转载

本文链接：https://blog.youkuaiyun.com/xinshuzhan/article/details/123718461

运维面试宝典专栏收录该内容

191 篇文章 ¥299.90 ¥399.90

订阅专栏

面对2亿条数据的缓存需求，单机无法胜任，需要采用分布式存储。本文探讨了使用Redis的三种解决方案：1) 哈希取余算法，简单但扩展性和容错性较差；2) 一致性哈希算法，通过减少数据迁移影响，提高扩展性；3) 哈希槽分区，通过固定数量的槽实现更均匀的数据分布。这三种方案各有优缺点，适用于不同的场景。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

对于2亿条数据需要缓存，使用单机肯定是不可能了，至少是分布式存储。

而分布式存储我们可以选择的选项有很多，今天我们单独来讨论下redis的解决方案。

使用redis如何落地。

在阿里p7工程案例和场景设计中，这一类的确是必问题，我们一般有三种解决方案：

第一种：哈希取余算法

在这里插入图片描述
2亿条记录假设2亿个k,v，我们单机不行必须要分布式多机，假设有3台机器构成一个集群，用户每次读写操作都是根据公式：

hash(key) % N个机器台数，计算出哈希值，用来决定数据映射到哪一个节点上。

比如0，就是最左的，1是中间的，2是最右边的。

这种方案是最常用的，也是最通用的

优点：
简单粗暴，直接有效，只需要预估好数据规划好节点，例如3台、8台、10台，就能保证一段时间的数据支撑。使用Hash算法让固定的一部分请求落到同一台服务器上，这样每台服务器固定处理一部分请求（并维护这些请求的信息），起到负载均衡+分而治之的作用。

缺点：
原来规划好的节点，进行扩容或者缩容就比较麻烦了，不管扩缩，每次数据变动导致节点有变动，映射关系需要重新进行计算。
在服务器个数固定不变时没有问题，如果需要弹性扩容或故障停机的情况下，原来的取模公式就会发生变化：Hash(key)/3会变成Hash(key) /?。此时地址经过取余运算的结果将发生很大变化，根据公式获取的服务器也会变得不可控。

某个red

了解本专栏

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

互联网老辛 你的鼓励是我最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。