布隆过滤器解决缓存穿透的原理

布隆过滤器是一种高效的数据结构,用于判断一个元素可能是否存在,但可能会有误判。通过多个哈希函数将元素映射到bit向量中,避免了传统数据结构的空间占用。在缓存穿透问题中,它可以预先过滤掉不可能存在的请求,减少对数据库的查询。此外,布隆过滤器还可应用于垃圾邮件和短信过滤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

布隆过滤器
作用

告诉你某个元素一定不存在或者可能存在,相比于传统的List、Set、Map等数据结构,它更高效、占用的控件更小。

数据结构

布隆过滤器是一个bit向量或者bit,如果我们要映射一个值到布隆过滤器中,我们㤇使用多个不同的哈希函数生成多个哈希值,并将每个生成的哈希值指向的bit位设置为1,如下baidu一词设置了三个位置为1

在这里插入图片描述

“tencent”一词,对应的情况

在这里插入图片描述

可以看到,不同的词对应的bit位置可能相同,当词很多的情况时,可能大部分bit位置都是1,这时查询taobao可能对应的位置都为1,只能说明taobao一词可能存在,不是一定存在的。

使用布隆过滤器

导入依赖

<dependency>
     <groupId>com.google.guava</groupId>
     <artifactId>guava</artifactId>
     <version>19.0</version>
</dependency>

代码

public class Test {

    private static int size = 1000000;//预计要插入多少数据

    private static double fpp = 0.01;//期望的误判率

    private static BloomFilter<Integer> bloomFilter = BloomFilter.create(Funnels.integerFunnel(), size, fpp);

    public static void main(String[] args) {
        //插入数据
        for (int i = 0; i < 1000000; i++) {
            bloomFilter.put(i);
        }
        int count = 0;
        for (int i = 1000000; i < 2000000; i++) {
            if (bloomFilter.mightContain(i)) {
                count++;
                System.out.println(i + "误判了");
            }
        }
        System.out.println("总共的误判数:" + count);
    }
}
应用场景

1.缓存穿透,当大量访问不存在数据的请求到达时,先用布隆过滤器过滤,避免直接去查库,查出来不存在。

public String get(String key) {
    String value = redis.get(key);     
    if (value  == null) {
        // redis中不存在该缓存
        if(!bloomfilter.mightContain(key)){
            //布隆过滤器也没有,直接返回
            return null; 
        }else{
            //布隆过滤器中能查到,不代表一定有,查出来放入redis,同样也可以避免缓存穿透
            value = db.get(key);
            redis.set(key, value); 
        }    
    }
    return value;
}

2.反垃圾邮件、垃圾短信,用布隆过滤器判断这些号码是否存在布隆过滤器中。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值