有一亿个keys要统计，应该用哪种集合？

最新推荐文章于 2025-12-17 20:46:39 发布

原创最新推荐文章于 2025-12-17 20:46:39 发布 · 214 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#redis

Redis 专栏收录该内容

16 篇文章

订阅专栏

本文详细解读了集合统计的四种关键概念：聚合统计（交并差）、排序统计（有序操作）、二值状态统计（bitmap）和基数统计（HyperLogLog）。讲解了如何运用这些统计方法于信息技术实践，包括数据处理和算法优化。

常用集合统计模式

聚合统计
排序统计
二值状态统计
基数统计

聚合统计

指统计多个集合元素的聚合结果
统计多个集合的共有元素（交集统计）
把两个集合相比，统计其中一个集合独有的元素（差集统计）
统计多个集合的所有元素（并集统计）

排序统计

list或者sorted_set类型
有序统计

二值状态统计

指集合元素的取值就只有 0 和 1 两种
bitmap，用 String 类型作为底层数据结构实现的一种统计二值状态的数据类型

基数统计

统计就是指统计一个集合中不重复的元素个数
set集合类型数据量过大占用空间过高
HyperLogLog 计算基数所需空间是固定的，每个 HyperLogLog 只需要花费 12 KB 内存，就可以计算接近 2^64 个元素的基数
HyperLogLog 的统计规则是基于概率完成的，所以它给出的统计结果是有一定误差的，标准误算率是 0.81%

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

蜗牛你慢点Ⅷ

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报