redis--bitmap实现去重

本文介绍了一种使用布隆过滤器优化Redis缓存中用户首次采集判断的方法。通过将用户MAC地址进行哈希处理并映射到位图(bitmap)上,有效地解决了传统key-value方式带来的无限增长问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、问题

    最近做一个探针项目,需要判断用户是不是第一次被采集,原来直接使用redis的key-value第一次缓存,过了段时间发现这样key会无穷无尽。。

2、解决方案

    使用布隆算法实现去重,布隆算法参考:漫画:Bitmap算法 整合版


    具体实现,针对具体用户的mac做hash,hash生成的结果作为bitmap的offset,bitmap即位图,每位保存0或1,1标识已经存在

    bitmap最多可以存储2的32次方,即4294967296,完全满足当前需求

3、redis的bitmap命令

    setbit key offset 1   //设置该位置为1

    getbit key offset     //查看该位置是否存在

    bitcount key           //统计总保存数

4、部分代码

Long offset = MD5util.filterhash(probeEntity.getPhoneMac());
if(redisServiceImpl.getbit(Constants.NEW_USER_KEY,offset)){
   probe.setState(1);
}else{
   probe.setState(0);
   redisServiceImpl.addbit(Constants.NEW_USER_KEY,offset);
}

@Override
    public boolean getbit(String key, Long offset) {
        return redisTemplate.opsForValue().getBit(key,offset);
    }

    @Override
    public void addbit(String key, Long offset) {
        redisTemplate.opsForValue().setBit(key,offset,true);
    }


### 使用Java操作RedisBitmap进行 在处理大量布尔值或需要高效的情况下,RedisBitmap是一个理想的选择。通过合理使用Bitmap,不仅可以提高数据存储和处理效率,还能简化程序逻辑[^1]。 为了实现基于Bitmap功能,在Java中通常会借助Jedis库来连接并操作Redis服务器。以下是具体的操作流程: #### 1. 添加依赖项 首先确保项目已引入`jedis`库作为与Redis交互的基础工具包。如果采用Maven构建,则可以在pom.xml文件内加入如下配置: ```xml <dependency> <groupId>redis.clients</groupId> <artifactId>jedis</artifactId> <version>4.0.0</version> </dependency> ``` #### 2. 编写核心业务逻辑代码 接下来展示一段简单的Java代码片段用于演示如何利用Bitmap特性完成元素的唯一性校验工作: ```java import redis.clients.jedis.Jedis; public class RedisBitMapExample { private static final String BITMAP_KEY = "unique_items_bitmap"; public boolean isUnique(Jedis jedis, long itemId){ // 获取指定位置上的bit值 (默认为false/0) Boolean exists = jedis.getbit(BITMAP_KEY, itemId); if (!exists) { // 如果不存在则设置该位为true(即1),表示此ID已被记录过 jedis.setbit(BITMAP_KEY,itemId,true); return true; }else{ // 已存在返回false return false; } } } ``` 上述函数接收一个`Jedis`实例对象以及待验证的目标编号(`itemId`)作为参数;内部先尝试读取对应索引处的状态,若发现为空(未被占用),便立即更新状态标记,并告知调用方当前传入的数据确实独一无二;反之则说明之前已经遇到相同的输入,因此直接给出否定的结果反馈。 这种方法特别适合用来追踪那些只需要关心是否存在而不需要关注具体内容的应用场景,比如统计某段时间内的独立访客数量或是判断某个特定事件是否发生过等情形[^2]。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值