Redis有一亿个keys要统计，应该用哪种集合？

最新推荐文章于 2024-10-17 16:29:54 发布

韩淼燃

最新推荐文章于 2024-10-17 16:29:54 发布

阅读量441

点赞数

CC 4.0 BY-SA版权

分类专栏：从入门到精通的Redis 文章标签：数据库 database 有一亿个keys要统计

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_36691991/article/details/120888511

从入门到精通的Redis 专栏收录该内容

36 篇文章 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

在处理亿级数据统计时，Redis的集合类型是关键。文章介绍了四种统计模式：聚合统计（如新增用户和留存用户）、排序统计（如最新评论列表）、二值状态统计（如签到打卡）和基数统计（如独立访客UV）。Set适合聚合统计，Sorted Set适用于排序统计，Bitmap用于二值状态统计，而HyperLogLog则在节省内存的同时估算基数。在选择集合类型时，需要根据场景需求和性能考虑。

在Web和移动应用的业务场景中，我们经常需要保存这样一种信息：一个key对应了一个数据集合。我举几个例子。

手机App中的每天的用户登录信息：一天对应一系列用户ID或移动设备ID；
电商网站上商品的用户评论列表：一个商品对应了一系列的评论；
用户在手机App上的签到打卡信息：一天对应一系列用户的签到记录；
应用网站上的网页访问信息：一个网页对应一系列的访问点击。

我们知道，Redis集合类型的特点就是一个键对应一系列的数据，所以非常适合用来存取这些数据。但是，在这些场景中，除了记录信息，我们往往还需要对集合中的数据进行统计，例如：

在移动应用中，需要统计每天的新增用户数和第二天的留存用户数；
在电商网站的商品评论中，需要统计评论列表中的最新评论；
在签到打卡中，需要统计一个月内连续打卡的用户数；
在网页访问记录中，需要统计独立访客（Unique Visitor，UV）量。

通常情况下，我们面临的用户数量以及访问量都是巨大的，比如百万、千万级别的用户数量，或者千万级别、甚至亿级别的访问信息。所以，我们必须要选择能够非常高效地统计大量数据（例如亿级）的集合类型。

要想选择合适的集合，我们就得了解常用的集合统计模式。这节课，我就给你介绍集合类型常见的四种统计模式，包括聚合统计、排序统计、二值状态统计和基数统计。我会以刚刚提到的这四个场景为例，和你聊聊在这些统计模式下，什么集合类型能够更快速地完成统计，而且还节省内存空间。掌握了今天的内容，之后再遇到集合元素统计问题时，你就能很快地选出合适的

了解本专栏

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

韩淼燃 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。