Redis从入门到入坟系列文章（七）：基数统计算法

最新推荐文章于 2025-08-30 23:54:28 发布

原创

最新推荐文章于 2025-08-30 23:54:28 发布 · 483 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

本文介绍了Redis中的基数统计算法HyperLogLog，它用于在大量数据中高效计算基数，占用固定且较小的内存空间。内容包括HyperLogLog的基本概念、应用场景，以及Redis提供的pfadd、pfcoun和pfmerge三个命令的使用方法。

今天来了解下Redis的基数统计算法结构HyperLogLog。HyperLogLog结构是Redis在在 2.8.9 版本新增加的。

HyperLogLog 是用来做基数统计的算法，HyperLogLog 的优点是，在输入元素的数量或者体积非常非常大时，计算基数所需的空间总是固定的、并且是很小的。在 Redis 里面，每个 HyperLogLog 键只需要花费 12 KB 内存，就可以计算接近 2^64 个不同元素的基数。

但是，因为 HyperLogLog 只会根据输入元素来计算基数，而不会储存输入元素本身，所以 HyperLogLog 不能像集合那样，返回输入的各个元素。

我们来了解下什么是基数？

一般来说一组数据中，去掉重复的数据后的数据，可称为基数。比如数据集 {1, 3, 5, 7, 5, 7, 8}，那么这个数据集的基数集为 {1, 3, 5 ,7, 8}, 基数(不重复元素)为5。基数估计就是在误差可接受的范围内，快速计算基数。

适合场景：

统计注册ip数量
统计网站访问人数，比如统计某一天或者某一月的活跃量

Redis提供了三个HyperLogLog的命令：

1、pfadd key element [element ...]：添加指定元素到 HyperLogLog 中。

如果一个HyperLogLog的估计的近似基数在执行命令过程中发了变化， PFADD 返回1，否则返回0，如果指定的key不存在，这个命令会自动创建一个空的HyperLogLog结构（指定长度和编码的字符串）。

如果在调用该命令时仅提供变量名而不指定元素也是可以的，如果这个变量名存在，则不会有任何操作，如果不存在，则会创建一个数据结构（返回1）。

127.0.0.1:6379> PFADD hll a b c d e f g
(integer) 1

2、PFCOUNT key [key ...]：返回给定 HyperLogLog 的基数估算值。

当参数为一个

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。