布隆过滤器demo

#include<iostream>
#include<bitset>
#include<string>
#define MAX 2<<24
using namespace std;

bitset<MAX> bloomSet;           //简化了由n和p生成m的过程 

int seeds[7]={3, 7, 11, 13, 31, 37, 61};     //使用7个hash函数 



int getHashValue(string str,int n)           //计算Hash值 
{
    int result=0;
    int i;
    for(i=0;i<str.size();i++)
    {
        result=seeds[n]*result+(int)str[i];
        if(result > 2<<24)
            result%=2<<24;
    }
    return result;
}


bool isInBloomSet(string str)                //判断是否在布隆过滤器中 
{
    int i;
    for(i=0;i<7;i++)
    {
        int hash=getHashValue(str,i);
        if(bloomSet[hash]==0)
            return false;
    }
    return true;
}

void addToBloomSet(string str)               //添加元素到布隆过滤器 
{
    int i;
    for(i=0;i<7;i++)
    {
        int hash=getHashValue(str,i);
        bloomSet.set(hash,1);
    }
}


void initBloomSet()                         //初始化布隆过滤器 
{
    addToBloomSet("http://www.baidu.com");
    addToBloomSet("http://www.renren.com");
    addToBloomSet("http://www.google.com");
}


int main(int argc, char *argv[])
{
    
    int n;
    initBloomSet();
    while(scanf("%d",&n)==1)
    {
        string str;
        while(n--)
        {
            cin>>str;
            if(isInBloomSet(str))
                cout<<"yes"<<endl;
            else
                cout<<"no"<<endl;
        }
        
    }
    return 0;
}

好的,我可以为您演示一个布隆过滤器的示例demo。假设我们有一个数据集合,其中包含一些字符串,比如"hello"、"world"、"python"等等。现在我们想要使用布隆过滤器来判断一个字符串是否在这个数据集合中。 首先,我们需要选择一些哈希函数。这些哈希函数应该能够将任意长度的字符串映射为一个固定长度的整数。在这个示例中,我们选择了三个哈希函数: ``` hash1(str) = (2 * str[0] + 3 * str[1] + 5) % 10 hash2(str) = (7 * str[0] + 11 * str[1] + 13) % 10 hash3(str) = (17 * str[0] + 19 * str[1] + 23) % 10 ``` 接下来,我们需要创建一个长度为10的位数组,并将所有位都初始化为0。这个位数组将用于表示数据集合中的所有字符串是否存在。 现在,我们可以将数据集合中的每个字符串分别进行哈希,并将对应的位数组中的位设置为1。例如,对于字符串"hello",我们可以将它分别使用哈希函数进行哈希,得到的结果分别为2、5、7。然后,我们将位数组中下标为2、5、7的位都设置为1。 最后,当我们想要判断一个字符串是否在数据集合中时,我们将该字符串分别使用哈希函数进行哈希,得到的结果分别为i1、i2、i3。然后,我们检查位数组中下标为i1、i2、i3的位是否都为1。如果都为1,那么说明该字符串可能存在于数据集合中;否则,说明该字符串一定不存在于数据集合中。 这就是一个简单的布隆过滤器示例demo。当然,实际使用中还需要考虑哈希函数的选择、位数组的大小、哈希冲突等问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值