CH 1401 兔子与兔子 字符串hash

这篇博客介绍了一个基于字符串哈希算法的问题,旨在解决判断两个DNA序列区间是否完全相同的问题。通过计算子串的哈希值并比较,可以在O(S+Q)的时间复杂度内得出结果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

描述
很久很久以前,森林里住着一群兔子。有一天,兔子们想要研究自己的 DNA 序列。我们首先选取一个好长好长的 DNA 序列(小兔子是外星生物,DNA 序列可能包含 26 个小写英文字母),然后我们每次选择两个区间,询问如果用两个区间里的 DNA 序列分别生产出来两只兔子,这两个兔子是否一模一样。注意两个兔子一模一样只可能是他们的 DNA 序列一模一样。

输入格式
第一行一个 DNA 字符串 S。
接下来一个数字 m,表示 m 次询问。
接下来 m 行,每行四个数字 l1, r1, l2, r2,分别表示此次询问的两个区间,注意字符串的位置从1开始编号。
其中 1 ≤ length(S), m ≤ 1000000

输出格式
对于每次询问,输出一行表示结果。如果两只兔子完全相同输出 Yes,否则输出 No(注意大小写)

样例输入
aabbaabb
3
1 3 5 7
1 3 6 8
1 2 1 2
样例输出
Yes
No
Yes

题意:判断一个字符串中,[l1,r1]与[l2,r2]是否完全相等

思路:利用字符串hash算法。设F[i]表示前缀子串S[1—i]的hash值,有F[i]=F[i-1]*131+(S[i]-'a'+1)

于是可以得到任意一个区间[l,r]的hash值为F[r]-F[l-1]*131^(r-l+1),当两个字符串的hash值相同的时候,两个子串相同,时间复杂度为O(S+Q)。

字符串hash算法:

  当已知的字符串S的hash值为H(S), 那么在S后加一个字符c构成一个新的字符串S+c的hash值为H(S+c)=(H(S)*P+value[c])mod M,其中P相当于P进制下的左移运算,value[c]代表着我们为c选定的值。

 当已知字符串S的hash值为H(S),字符串S+H的hash值为H(S+H),那么字符串T的hash值为H(T)=(H(S+T)-H(S)*P^length(T))%M。相当于通过P进制下在S后补0的方式,把S左移到与S+T的左端对齐,然后二者相减得到H(T)

#include <cstdio>
#include <iostream>
#include <cstring>
#include <algorithm>
#include <map>
#include <set>
#include <queue>
#include <cmath>
#include <vector>
using namespace std;
const int MAXN=1e6+5;
typedef long long ll;
ll f[MAXN],p[MAXN];
char s[MAXN];
int main()
{
    scanf("%s",s+1);
    int n=strlen(s+1),q;
    cin>>q;
    p[0]=1;
    for(int i=1;i<=n;i++){
        f[i]=f[i-1]*131+(s[i]-'a'+1); //hash 1——i
        p[i]=p[i-1]*131;
    }
    for(int i=1;i<=q;i++){
        int l1,r1,l2,r2;
        scanf("%d%d%d%d",&l1,&r1,&l2,&r2);
        if(f[r1]-f[l1-1]*p[r1-l1+1]==f[r2]-f[l2-1]*p[r2-l2+1])
            puts("Yes");
        else
            puts("No");
    }
    return 0;
}

 

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值