Redis HyperLogLog 是用来做基数统计的算法,HyperLogLog 的优点是,在输入元素的数量或者体积非常非常大时,计算基数所需的空间总是固定 的、并且是很小的。
比如数据集 {1, 3, 5, 7, 5, 7,
8}, 那么这个数据集的基数集为
{1, 3, 5 ,7, 8}, 基数(不重复元素)为5。
基数估计就是在误差可接受的范围内,快速计算基数。
添加指定元素到 HyperLogLog
中(pfadd):
返回给定 HyperLogLog 的基数估算值(pfcount):
127.0.0.1:6379> pfadd java "j"
(integer) 1
127.0.0.1:6379> pfcount java
(integer) 1
127.0.0.1:6379> pfadd java "a"
(integer) 1
127.0.0.1:6379> pfcount java
(integer) 2
127.0.0.1:6379> pfadd java "v"
(integer) 1
127.0.0.1:6379> pfcount java
(integer) 3
将多个
HyperLogLog 合并为一个 HyperLogLog(pfmerge):127.0.0.1:6379> pfadd java "j"
(integer) 1
127.0.0.1:6379> pfcount java
(integer) 1
127.0.0.1:6379> pfadd java "a"
(integer) 1
127.0.0.1:6379> pfcount java
(integer) 2
127.0.0.1:6379> pfadd java "v"
(integer) 1
127.0.0.1:6379> pfcount java
(integer) 3
127.0.0.1:6379> pfadd php "p"
(integer) 1
127.0.0.1:6379> pfcount php
(integer) 1
127.0.0.1:6379> pfadd php "h"
(integer) 1
127.0.0.1:6379> pfcount php
(integer) 2
127.0.0.1:6379> pfmerge all php java
OK
127.0.0.1:6379> pfcount all
(integer) 5