redis数据结构HyperLogLog

最新推荐文章于 2025-04-20 18:40:13 发布

阿木木可爱吗

最新推荐文章于 2025-04-20 18:40:13 发布

阅读量145

点赞数

文章标签： redis 缓存 java

本文链接：https://blog.youkuaiyun.com/weixin_64161454/article/details/129361680

版权

HyperLogLog是一种概率算法，用于在不存储所有值的情况下估算大型集合的基数，常用于统计独立访客UV。在Redis中，HLL基于string结构，内存占用极低，虽然存在小于0.81%的误差，但适合UV统计。示例代码展示了如何使用HLL添加数据并获取估算的集合大小。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

HyperLogLog

首先我们搞懂两个概念:

UV: 全称Unique Visitor，也叫独立访客量，是指通过互联网访问、浏览这个网页的自然人。1天内同一个用户多次访问该网站，只记录1次。

PV: 全称Page View，也叫页面访问量或点击量，用户每访问网站的一个页面，记录1次PV，用户多次打开页面，则记录多次PV。往往用来衡量网站的流量。

UV统计在服务端做会比较麻烦，因为要判断该用户是否已经统计过了，需要将统计过的用户信息保存。但是如果每个访问的用户都保存到Redis中，数据量会非常恐怖。

HyperLogLog用法

Hyperloglog(HLL)是从Loglog算法派生的概率算法，用于确定非常大的集合的基数，而不需要存储其所有值。

redis中的HLL是基于string结构实现的，单个HLL的内存永远小于16kb，内存占用低的令人发指!作为代价，其测量结果是概率性的，有小于0.81%的误差。不过对于UV统计来说，这完全可以忽略。

代码实现

 void test5() {
        String[] strArray = new String[1000];
        int index = 0;
        String key = "hl2";
        for (int i = 0; i < 1000000; i++) {
            index = i % 1000;
            strArray[index] = "test" + i;
            if(index == 999){
                stringRedisTemplate.opsForHyperLogLog().add(key,strArray);
            }
        }

        Long size = stringRedisTemplate.opsForHyperLogLog().size(key);
        System.out.println("size = " + size);
    }