题目描述
Farmer John 最近购入了 N 头新的奶牛(3≤N≤5×10^5),每头奶牛的品种是更赛牛(Guernsey)或荷斯坦牛(Holstein)之一。奶牛目前排成一排,Farmer John 想要为每个连续不少于三头奶牛的序列拍摄一张照片。 然而,他不想拍摄这样的照片,其中只有一头牛的品种是更赛牛,或者只有一头牛的品种是荷斯坦牛——他认为这头奇特的牛会感到孤立和不自然。 在为每个连续不少于三头奶牛的序列拍摄了一张照片后,他把所有「孤独的」照片,即其中只有一头更赛牛或荷斯坦奶牛的照片,都扔掉了。
给定奶牛的排列方式,请帮助 Farmer John 求出他会扔掉多少张孤独的照片。如果两张照片以不同的奶牛开始或结束,则认为它们是不同的。
输入
输入的第一行包含 N。
输入的第二行包含一个长为 N 的字符串。如果队伍中的第 i 头奶牛是更赛牛,则字符串的第 i 个字符为 G。否则,第 i 头奶牛是荷斯坦牛,该字符为 H。
输出
输出 Farmer John 会扔掉的孤独的照片数量。
样例数据
输入 #1 复制
5 GHGHG
输出 #1 复制
3
数据范围限制
测试点 1-3 满足 N≤50。
测试点 4-9 满足 N≤5000。
为了增加一些挑战,测试点 10 没有额外限制。注意这个测试点的答案可能无法用标准的 32 位整数型存储,你可能需要使用更大的整数类型(例如,C++ 中 64 位的 "long long int" 类型)。
提示
这个例子中的每一个长为 3 的子串均恰好包含一头更赛牛或荷斯坦牛——所以这些子串表示孤独的照片,并会被 Farmer John 扔掉。所有更长的子串(GHGH、HGHG 和 GHGHG)都可以被接受。
题目大意
在仅包含字符 H 和 G 的字符串 s 中,有多少个子串:
- 包含一个 H,包含至少两个 G;
- 包含一个 G,包含至少两个 H。
满足要求。
思路
第一反应是枚举字符串左端点 l,右端点 r,然后统计在 [l,r],范围内 G 和 H 分别出现的次数。时间复杂度 Θ(n3),前缀和优化后 Θ(n2),面对 n≤5⋅105 的数据范围望而生畏。
既然打暴力行不通,那么只能考虑数学解法:
仔细观察满足条件的子串要求,发现了什么?有一个字符只出现一次!
根据这个条件,我们可以设计出合理的算法:枚举满足要求的子串中心点 si (即只出现一次的那个字符的位置)。如果它可以像左拓展至 l(即 sl−1=si),可以像右拓展至 r(即 sr+1=si),那 端点在 [l,r] 之间且经过 i 的子串(长度 len≥3)均满足要求!
最坏情况时间复杂度 Θ(n2),预处理每个 i 的 l 和 r 后 Θ(n),完美通过此题。
更多细节在代码中展示。
code:
#include<bits/stdc++.h>
#define int long long //注意这个测试点的答案可能无法用标准的 32 位整数型存储
using namespace std;
const int N=5e5+5;
int pre[N],nxt[N],n,ans;
signed main() {
string s;
cin>>n>>s;
int preH=-1,preG=-1; //左端点初值默认-1
for(int i=0;i<s.size();i++) { //预处理l
if(s[i]=='H') pre[i]=preH,preH=i;
if(s[i]=='G') pre[i]=preG,preG=i;
}
int nxtH=n,nxtG=n; //右端点初值默认n
for(int i=s.size()-1;i>=0;i--) { //预处理r
if(s[i]=='H') nxt[i]=nxtH,nxtH=i;
if(s[i]=='G') nxt[i]=nxtG,nxtG=i;
}
for(int i=0;i<s.size();i++) {
ans+=(i-pre[i])*(nxt[i]-i)-1;
/*根据乘法原理,端点在[l,r]之间且经过i的子串个数为左可拓展长度*右可拓展长度*/
if(nxt[i]!=i+1) --ans; //处理长度小于3的子串
if(pre[i]!=i-1) --ans;
}
printf("%lld",ans);
return 1;
}