蓝桥杯练习-3.13
视频学习
• 人物相关性的分析-<滑动窗口>
【问题描述】
小明正在分析一本小说中的人物相关性。他想知道在小说中 Alice 和 Bob有多少次同时出现。
更准确的说,小明定义 Alice 和 Bob“同时出现”的意思是:在小说文本中 Alice 和 Bob 之间不超过 K 个字符。
例如以下文本:
This is a story about Alice and Bob. Alice wants to send a private message to Bob.
假设 K = 20,则 Alice 和 Bob 同时出现了 2 次,分别是”Alice and Bob”和”Bob. Alice”。前者 Alice 和 Bob 之间有 5 个字符,后者有 2 个字符。
注意:
\1. Alice 和 Bob 是大小写敏感的, alice 或 bob 等并不计算在内。
\2. Alice 和 Bob 应为单独的单词,前后可以有标点符号和空格,但是不能有字母。例如 Bobbi 並不算出现了 Bob。
【输入格式】
第一行包含一个整数 K。
第二行包含一行字符串,只包含大小写字母、标点符号和空格。长度不超过 1000000。
【输出格式】
输出一个整数,表示 Alice 和 Bob 同时出现的次数。
【样例输入】
20
This is a story about Alice and Bob. Alice wants to send a private message to Bob.
【样例输出】
2
思路:
定义两个动态数组 alice bob,首先从头到尾搜索输入的字符串,找到Alice和Bob出现的首字母在字符串中的位置,存入对应的动态数组当中去,如下图所示:
接下来就有一种很直观的做法,先用一个循环枚举每一个alice出现的位置,再用一个循环枚举bob出现的位置,然后在判断a[i]和b[j]判断这两个字符中间有没有超过k个字符,这是一个对的算法,但是特别容易超时。
优化思路
当我们要枚举很多量的时候,尝试下能不能只枚举一个量,然后另一个量能不能用其他方式不枚举,可以用二分,哈希表(空间换时间)。
这道题,我们只枚举alice,考虑alice出现在A1那一次的时候,在bob出现的那么多次,有那几次距离A1是不超过k,也就是bob在[A1 - k - 3, A1 + 5 + k]这个范围内,所谓的减3加5是考虑alice和bob本身的字符长度。主要Bi在这个范围内,就符合,算同时出现,然后看看A2,有多少个Bi出现,以此类推。
随着Ai的变化,区间 [Ai - k - 3, Ai + 5 + k]会变化,逐渐向后移,(滑动窗口)
然后主要代码实现如下:
vector<int> alice, bob;//创建两个数组
long long ans = 0;//用来记录同时出现的次数
bob.push_back(-10000000);//这里在很远很远的地方插入一个bob,方便处理边界值
bob.push_back(10000000);
int ca = alice.size();//alice数组的长度
int cb = bob.size();
int lp = 0, rp = 0;//滑动窗口的两个端点
for(int i = 0; i < ca; i++) {//alice和bob都是排好序放进去的
while(bob[lp] < alice[i] - 3 - k) lp++;//这个while循环就是让窗口移动,当bob[lp]进入到了当前Ai的左区间内就停止
while(bob[rp + 1] <= alice[i] + 5 + k) rp++;//保证到达Ai的右区间
if(rp - lp + 1 > 0) ans += rp - lp + 1;//然后在这个区间里面的所有的bob都是符合的,计算下标差就可知道有几个符合条件的
}
cout << ans << endl;
完全代码:
#include <iostream>
#include <string>
#include <vector>
using namespace std;
const int N = 4e6+9;
int a[N], b[N];
string s;
long long ans = 0;
int solve(string ss,int *cnt)//求字符串ss在串s中出现的位置
{
int t = 0, n = s.size();//t用来记录bob数组和alice数组的下标
for (int i = 0; i < n; i++)
{
if(s[i] == ss[0])//寻找首字母第一个跟传过来的字符串相同的
{
if(i)//判断这个字母前面是不是字母
{
char ch = s[i - 1];
if((ch >= 'a' && ch <= 'z')||(ch >= 'A' && ch <= 'Z')) continue;//如果是字母的话,这个首字母就不可
//能构成名字,直接退出本次循环
}
int flag = 1, j;
string tmp = "";//等等用来比对是不是跟传过来的字符串一样
for (j = i; j < n && j - i< ss.size(); j++)//不仅要<原来字符串长度要<总的文章长度
{
tmp += s[j];
}
if(tmp != ss) flag = 0;//如果不一样的话人,不满足
if(j < n &&((s[j]>='a'&&s[j]<='z')||(s[j]>='A'&&s[j]<='Z'))) flag = 0;//如果名字后面也是字母,也不满
//足
if(flag) cnt[t++] = i;
}
}
return t;
}
int main()
{
int k;
cin >> k;
getchar();
getline(cin, s);
int ca = solve("Alice",a);
int ba = solve("Bob",b);
int lp = 0, rp = 0;
for (int i = 0; i < ca; i++)
{
while(b[lp] < a[i] - k - 3) lp++;
while(b[rp] <= a[i] + 5 + k) rp++;
if (rp - lp > 0) ans += (long long)rp - lp;
}
cout << ans << endl;
return 0;
}