让你弄懂什么是缓存穿透，并轻松get布隆过滤器原理，快速上手。

最新推荐文章于 2024-09-08 10:18:53 发布

原创最新推荐文章于 2024-09-08 10:18:53 发布 · 289 阅读

0 ·

CC 4.0 BY-SA版权

Redis 专栏收录该内容

37 篇文章

订阅专栏

本文介绍缓存穿透现象及其解决方案，并深入探讨布隆过滤器的工作原理及其实现方式，包括Guava和Redis的应用。

一、什么是缓存穿透？

一图胜千言，如下图，当访问到数据库中没有的数据的时候，每次访问同样的数据，都会绕过缓存系统（一般是Redis），直接访问到数据库层，这就是我们说的缓存穿透。

解决办法：

我们可以在缓存中将这样的数据也缓存起来，只是缓存的key的value为空。

但是如果有特别多的key是这种情况的，我们的缓存中要缓存好多这样的key，比较占用缓存。

另外如果这种key访问的次数比较少，我们缓存这种key的效果也不是很好。

于是引出了一种办法：

我们有什么办法可以让这样的数据在访问缓存之前，就可以被判断出来是否在我们的系统中呢？

对，这就是布隆过滤器要做的事情了。他可以判断一个key是否存在。
在这里插入图片描述

二、布隆过滤器原理

布隆过滤器是位图的数据结构，与一系列哈希算法的结合。

我们有四个key：key1、key2、key3、key4。

两种哈希算法：hash1、hash2。

我们将每个key用多种哈希算法映射到我们下面的位图中。

当我们判断一个key是否存在的时候，就去对应的位置上看值是否都为1。

但是有一个问题，如果key对应的位置不都为1，那么这个key一定不存在。

但是key对应位置都为1，这个key不一定存在于我们的系统当中，有些晕了吧，看下图的key3不一定存在与我们系统中哦，因为他对应的位置上可能是其他的key对应的。

也就是说布隆过滤器是有误差的。
在这里插入图片描述

三、上手布隆过滤器

我知道了布隆过滤器的原理，那么如何来使用呢？

难道这些算法要我们自己来实现吗？当然不用啦。

1、guava的实现

guava里面已经有实现了，我们直接引入jar包后，直接调用就好了。

<dependency>
    <groupId>com.google.guava</groupId>
    <artifactId>guava</artifactId>
    <version>19.0</version>
</dependency>

代码如下：

// 预计要插入多少数据
private static int size = 1000000;

// 期望的误判率
private static double fpp = 0.01;

private static BloomFilter<Integer> bloomFilter = BloomFilter.create(Funnels.integerFunnel(), size, fpp);

public static void main(String[] args) {
    // 插入数据
    for (int i = 0; i < 1000000; i++) {
        bloomFilter.put(i);
    }
    int count = 0;
    for (int i = 1000000; i < 2000000; i++) {
        if (bloomFilter.mightContain(i)) {
            count++;
        }
    }
    System.out.println("总共的误判数: " + count);
}

2、Redis的实现

我们去RedisBloom的官网下载源文件。

然后呢，将下载的jar包make一下。

Redis会以module的方式将RedisBloom加载进来使用，类似于扩展的效果。

我们只需要在Redis的配置文件redis.conf中加入编译完的RedisBloom生成的可执行命令的路径，即可，如下：

loadmodule /root/RedisBloom-2.2.4/redisbloom.so

在我们的命令行中，就可以使用如下命令操作布隆过滤器了：

-- 向我们的布隆过滤器当中加入要判断的内容
bf.add 
-- 判断内容是否存在于我们的布隆过滤器当中
bf.exists
-- 初始化我们的布隆过滤器，如打算里面放入多少个元素，能容忍的误差率
bf.reserve

根据我们的预期，布隆过滤器底层会来判断使用多少位的位图，使用几个hash算法等，实现我们的目标。

四、总结时间

布隆过滤器利用较小的空间，应用于判断大量key是否存在的场景。

guava的实现，利用应用程序所在服务器的内存资源，多个服务器的话，需要自己判断自己的。

Redis的实现，利用Redis的内存资源，应用程序可以调用Redis中的布隆过滤器来做相应判断。

本文从缓存穿透的问题，到如何解决缓存穿透的问题，再到布隆过滤器的原理，以及如何应用布隆过滤器，和对比其实现方式，期望能够对大家有所帮助。