灵梦有n个单词想要背,但她想通过一篇文章中的一段来记住这些单词。
文章由m个单词构成,她想在文章中找出连续的一段,其中包含最多的她想要背的单词(重复的只算一个)。并且在背诵的单词量尽量多的情况下,还要使选出的文章段落尽量短,这样她就可以用尽量短的时间学习尽可能多的单词了。
第1行一个数n,
接下来n行每行是一个长度不超过10的字符串,表示一个要背的单词。
接着是一个数m,
然后是m行长度不超过10的字符串,每个表示文章中的一个单词。
输出文件共2行。第1行为文章中最多包含的要背的单词数,第2行表示在文章中包含最多要背单词的最短的连续段的长度。
3
hot
dog
milk
5
hot
dog
dog
milk
hot
3
3
对于30%的数据 n<=50,m<=500;
对于60%的数据 n<=300,m<=5000;
对于100%的数据 n<=1000,m<=100000;
这是一道哈希的好题,首先利用RK哈希,将字符串哈希成一个数,然后对应在哈希表找到相应的位置。有了哈希表后,我们可以轻松查找一个字符串是否出现在哈希表中,统计出现在哈希表中的字符串个数,也就是题目要求的第一问,然后我们利用两根指针L,R,让R不停地往右走,当[L.R]区间包含了第一问求出的字符串个数时,我们让L往右走,一直到字符串个数要减少一个(L再多往右走一步的话),此时先更新答案,并且让L++,R++,继续上述过程,直到R=m.这中间需要统计每个字符串出现的个数,因为我们关注字符串个数达到最大和减少1个的状态,因此需要这个数组来帮助。由于L和R都只会往右走1遍,因此这个过程的复杂度是线性,太牛逼了!
代码:
#include<cstdio>
#include<iostream>
#include<cstring>
using namespace std;
const int mod=1000007;
struct ha{
int num;
char s[12];
}hash[1000007];
unsigned gethash(char *c){
unsigned t=0;
for(int i=0;c[i];i++)
t=(t*131+c[i]-'a')%mod;
return t;
}
int HASH(char *c){
int t=gethash(c)%mod;
while(hash[t].num&&strcmp(hash[t].s,c))
t=(t+1)%mod;
return t;
}
int ans;
int h[1000007],vis[1000007],cnt[1000007];
int main()
{
int n,m;
char c[12];
cin>>n;
for(int i=0;i<n;i++){
scanf("%s",c);
int t=HASH(c);
strcpy(hash[t].s,c);
hash[t].num=1;
}
cin>>m;
for(int i=0;i<m;i++){
scanf("%s",c);
h[i]=HASH(c);
if(hash[h[i]].num&&!vis[h[i]]){
ans++;vis[h[i]]=1;
}
}
if(!ans) {printf("0\n0\n");return 0;}
int l=0,r=0,res=0,ret=1<<30;
while(r<m){
while(r<m){
if(hash[h[r]].num&&!cnt[h[r]])
res++;
cnt[h[r]]++;
if(res==ans) break;
r++;
}
if(r==m) break;
while(!hash[h[l]].num||cnt[h[l]]>1){
cnt[h[l]]--;l++;
}
ret=min(ret,r-l+1);
cnt[h[l]]=0;l++;r++;res--;
}
printf("%d\n%d\n",ans,ret);
return 0;
}