字符串哈希简单理解

字符串哈希 —— 模板题 AcWing 841. 字符串哈希

字符串前缀哈希方法

哈希函数的定义为h(str) = Sum_1_l(str[i] * p^(l-i+1))
观察这个函数定义的P进制数和十进制数一样,左边的权重越来越大。

那么对h[l,r]这个区间的哈希值如何取呢?

  • 就类似十进制的1234567取(3,5)区间的345,即12345-12*10^3,注意由于12345是包含了整个左侧的前缀,因此减去左侧的时候,应该将左侧的12部分乘上其应该有的权重。
  • 那么字符串区间的哈希值就是h[r] - h[l - 1] * p^(r - l + 1),注意下面代码实现p是通过数组累乘先存着,计算复杂度小,同时取模不会有问题

注意:

  • 一般不映射到0,如A映射为0,那么AA = 0*P+0 = 0,一定冲突,因此从1开始映射
  • hash 冲突的解决,P的经验值是131或13331,取模的数用2^64,这样取的 冲突概率低

核心思想:将字符串看成P进制数,P的经验值是131或13331,取这两个值的冲突概率低
小技巧:取模的数用2^64,这样直接用unsigned long long存储,溢出的结果就是取模的结果

typedef unsigned long long ULL;
ULL h[N], p[N]; // h[k]存储字符串前k个字母的哈希值, p[k]存储 P^k mod 2^64

// 初始化
p[0] = 1;
h[0] = 0;
for (int i = 1; i <= n; i ++ )
{
    h[i] = h[i - 1] * P + str[i];
    p[i] = p[i - 1] * P;
}

// 计算子串 str[l ~ r] 的哈希值
ULL get(int l, int r)
{
    return h[r] - h[l - 1] * p[r - l + 1];
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AlwaysDayOne

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值