一般的缓存系统,都是按照key去缓存查询,如果不存在对应的value,就应该去后端系统查找(比如DB)。如果恶意攻击者大量构造不存在的key的请求访问我们的系统,那么这些请求将会直接穿透到我们的后端系统,结果就是——

神器
bloom Filter算法
它的特点
对于一个很大的集合,能使用很小的空间存储其相关元信息,达到以下效果:当该算法计算出某个key不在集合中,那么其一定不在集合中。(当该算法计算出某个key可能在集合中,那么其存在一定概率存在集合中)
使用场景
使用该算法可以高效率地过滤若干百分比(视元数据大小及一些算法参数而定)的无效请求,减轻无效缓冲穿透带来的压力
实现原理
根据全量的数据计算一个二进制向量集合
当一个元素被加入集合时,通过K个散列函数将这个元素映射成一个位数组中的K个点,把它们置为1。
判断一个元素是否一定不在集合中
检索时,我们只要看看这些点是不是都是1就(大约)知道集合中有没有它了:如果这些点有任何一个0,则被检元素一定不在;如果都是1,则被检元素很可能存在
别说了,秘笈赶紧转发收藏

本文介绍如何利用布隆过滤器算法高效过滤无效请求,减轻缓存穿透带来的后端系统压力。通过二进制向量集合存储数据的元信息,即使在空间较小的情况下也能快速判断某些元素是否存在。
85

被折叠的 条评论
为什么被折叠?



