1. HyperLogLog结构?
Redis HyperLogLog是用来做基数统计的算法,HyperLogLog的优点是,在输入元素的数量或者体积非常非常大时,计算基数所需的空间总是固定的、并且是很小的。
在Redis里面,每个HyperLogLog键只需要花费12KB内存,就可以计算接近264个不同元素的基数。这和计算基数时,元素越多耗费内存就越多的集合形成了显明的对比。但是,因为HyperLogLog键只会根据输入元素来计算基数,而不会存储输入元素本身,所以HyperLogLog不能像集合那样,返回输入的各个元素。
什么是基数?
比如数据集{1,3,5,7,5,7,8},那么这个数据集的基数集就是{1,3,5,7,8},那么基数(不重复元素个数)就是为5。基数估计就是在误差可接受的范围内,快速计算。
2. HyperLogLog的工作过程
redis 127.0.0.1:6379> PFADD runoobkey "redis"
1) (integer) 1
redis 127.0.0.1:6379> PFADD runoobkey "mongodb"
1) (integer) 1
redis 127.0.0.1:6379> PFADD runoobkey "mysql"
1) (integer) 1
redis 127.0.0.1:6379> PFCOUNT runoobkey
(integer) 3
3. HyperLogLog的常用指令
| 命令 | 解释 |
|---|---|
PFADD key element [element...] | 添加指定元素到HyperLogLog结构中 |
PFCOUNT key [key...] | 返回给定HyperLogLog的基数估算值 |
PFMERGE destkey sourcekey [sourcekey] | 将多个HyperLogLog合并为一个HyperLogLog |
介绍Redis中HyperLogLog数据结构及其工作原理,该结构用于高效地估算大量数据的基数,仅需固定且较小的内存空间,适用于处理大规模数据集。文章还概述了HyperLogLog的主要命令。
4280

被折叠的 条评论
为什么被折叠?



