题目
给定整数 p 和 m ,一个长度为 k 且下标从 0 开始的字符串 s 的哈希值按照如下函数计算:
hash(s, p, m) = (val(s[0]) * p0 + val(s[1]) * p^1 + ... + val(s[k-1]) * p^k-1) mod m.
其中 val(s[i]) 表示 s[i] 在字母表中的下标,从 val(‘a’) = 1 到 val(‘z’) = 26 。
给你一个字符串 s 和整数 power,modulo,k 和 hashValue 。请你返回 s 中 第一个 长度为 k 的 子串 sub ,满足 hash(sub, power, modulo) == hashValue 。
测试数据保证一定 存在 至少一个这样的子串。
子串 定义为一个字符串中连续非空字符组成的序列。
提示:
1 <= k <= s.length <= 2 * 10^4
1 <= power, modulo <= 10^9
0 <= hashValue < modulo
s 只包含小写英文字母。
测试数据保证一定 存在 满足条件的子串。
示例 :
输入:s = "leetcode", power = 7, modulo = 20, k = 2, hashValue = 0
输出:"ee"
解释:"ee" 的哈希值为 hash("ee", 7, 20) = (5 * 1 + 5 * 7) mod 20 = 40 mod 20 = 0 。
"ee" 是长度为 2 的第一个哈希值为 0 的子串,所以我们返回 "ee" 。
思路-滑动窗口
首先可以判断一下,可不可以进行暴力求解——建立一个哈希函数,每次提取k个字符并进行计算。
从s第一个字符开始遍历,最多需要2*10^4,计算哈希函数时需要遍历k次从而hash(s, p, m),循环次数较多,时间复杂度O(k*n),会出现超时情况,不能考虑。
我们可以发现,每次需要取k个连续的字符进行计算,因此我们可以采用滑动窗口思想,k就是窗口的大小。通过在字符串中移动串口,来获取不同的字符串组合,并确定相应的hash值。
hash(s, p, m) = (val(s[0]) * p0 + val(s[1]) * p^1 + ... + val(s[k-1]) * p^k-1) mod m
如果从s第一个元素开始滑动窗口,滑动后需要把第一个元素去掉,然后将原有剩余k-1项左移,这时需要这k-1项原来计算的val(s[1]) * p^1 + … + val(s[k-1]) * p^k-1除以p(但是原值已经对m取余了)用于减小p的幂,再在最后加一个元素*p^k-1。这是很麻烦的,因此需要换一种思路。
从前向后不行,我们可以建立从后向前的滑动窗口:
对于每一次滑动,记录上次窗口hash(s1,p,m)为sum
- 首先去除窗口中最后一项(与pk-1相乘的项,即val[s[i+k]]*pk-1),即sum-val[s[i+k]]*pk-1
- 将减去后的sum*p,用于将窗口中剩余k-1项的系数乘p,使p的幂增加,相当于右移。
- 将字符串中当前指向s[i]加入窗口中,即sum+val(s[i])
- 如果当前sum等于hashvalue,记录
- 依次将窗口滑到字符串s初始位置结束
注:在计算中尤其要注意取模问题(1 <= power, modulo <= 10^9)
- 保险起见,每次加和乘都需要进行取模
- 在进行相减时,如果被减数被取模过,相减后记得加上取模值m。不然相减后有可能是负数
代码
class Solution {
public:
string subStrHash(string s, int power, int m, int k, int hashValue) {
long long sum = 0, p = 1;
int len = s.size();
for(int i=len-1;i>=len-k;i--){
if(i!=len-k) p = (p%m * power)%m;
sum = (sum*power%m + (s[i]-'a'+1)%m)%m;
}
int begin;
if(sum==hashValue) begin = len-k;
for(int i=len-k-1;i>=0;i--){
sum = ((sum - ((s[i+k]-'a'+1)*p)%m + m)%m*power%m + s[i]-'a'+1)%m;
if(sum==hashValue)
begin = i;
}
return s.substr(begin, k);
}
};