字符串处理基本算法----字符串哈希

本文介绍了一种用于字符串匹配的Hash算法,通过将字符串转换为数值并利用特定的底数(base)来生成唯一的Hash值,从而实现高效查找。文章还提供了核心代码示例。

字符串匹配算法之字符串hash

我们平时在计数还有排序等基本操作中就经常会用到hash的思想,其本质就是将数值与需要操作的数据进行一一对应且不出现重复(重复这个算法就没意义了嘛)
既然一般的数字我们可以进行Hash,那么字符是否可以Hash呢?答案当然是肯定的!

为了更好地理解Hash,先给大家举个栗子,对与任意一个数字,我们将他转化为二进制之后可以表示成这样:
2(len[i]1)num[i]+2(len[i1]1)num[i1]...+201num[0]=number2(len[i]−1)∗num[i]+2(len[i−1]−1)∗num[i−1]...+20∗1∗num[0]=number

—->101010=251+240+231+220+211+200101010=25∗1+24∗0+23∗1+22∗0+21∗1+20∗0

那么对于字符串我们一样可以进行相同的转化!

我们可以将Hash[len]Hash[len]记为长度为LenLen的前缀的hashhash

那么对于字符串ss的某一段前缀,我们可以将他转化为如下形式

Hash[i]=s[1]xi+s[2]x(i1)+...+s[i]x0

联系二进制数值的转化,我们发现我们需要一个底数以避免不同字符串有相同的hashhash值,我们可以叫他basebase,

basebase在这里我们一般取个131就够了,所以我要取个233(我就是要皮一下)

basebase也不能随意取,一般我们取的是一个质数尽可能的减少hashhash值相等的意外。

综上所述,对于LL~R区间的字符串,他们的hashhash值便为
Hash[R]Hash[L]base(RL+1)Hash[R]−Hash[L]∗base(R−L+1)

至此,字符串hashhash的所有内容便讲完啦,是不是很简单!

下面是核心代码

ll base=233;

string s;

ll Hash[100005];
ll Base[100005];

void init()
{
    Base[0]=1;
    Hash[0]=0;
    for(int i=1;i<=100004;i++)
        Base[i]=Base[i-1]*base;
    for(int i=1;i<=s.size();i++)
        Hash[i]=Hash[i-1]*base+s[i]-' ';
}

int main()
{
    ios::sync_with_stdio(false);
    cin.tie(0);
    init();
}
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值