1552. 【USACO 2021 December Bronze】Lonely Photo-优快云博客

本文链接：https://blog.youkuaiyun.com/huangjinhao222/article/details/146052040

题目描述

Farmer John 最近购入了 N 头新的奶牛（3≤N≤5×10^5），每头奶牛的品种是更赛牛（Guernsey）或荷斯坦牛（Holstein）之一。奶牛目前排成一排，Farmer John 想要为每个连续不少于三头奶牛的序列拍摄一张照片。然而，他不想拍摄这样的照片，其中只有一头牛的品种是更赛牛，或者只有一头牛的品种是荷斯坦牛——他认为这头奇特的牛会感到孤立和不自然。在为每个连续不少于三头奶牛的序列拍摄了一张照片后，他把所有「孤独的」照片，即其中只有一头更赛牛或荷斯坦奶牛的照片，都扔掉了。

给定奶牛的排列方式，请帮助 Farmer John 求出他会扔掉多少张孤独的照片。如果两张照片以不同的奶牛开始或结束，则认为它们是不同的。

输入

输入的第一行包含 N。

输入的第二行包含一个长为 N 的字符串。如果队伍中的第 i 头奶牛是更赛牛，则字符串的第 i 个字符为 G。否则，第 i 头奶牛是荷斯坦牛，该字符为 H。

输出

输出 Farmer John 会扔掉的孤独的照片数量。

样例数据

输入 #1 复制

5
GHGHG

输出 #1 复制

数据范围限制

测试点 1-3 满足 N≤50。
测试点 4-9 满足 N≤5000。
为了增加一些挑战，测试点 10 没有额外限制。注意这个测试点的答案可能无法用标准的 32 位整数型存储，你可能需要使用更大的整数类型（例如，C++ 中 64 位的 "long long int" 类型）。

提示

这个例子中的每一个长为 3 的子串均恰好包含一头更赛牛或荷斯坦牛——所以这些子串表示孤独的照片，并会被 Farmer John 扔掉。所有更长的子串（GHGH、HGHG 和 GHGHG）都可以被接受。

题目大意

在仅包含字符 H 和 G 的字符串 s 中，有多少个子串：

包含一个 H，包含至少两个 G；
包含一个 G，包含至少两个 H。

满足要求。

思路

第一反应是枚举字符串左端点 l，右端点 r，然后统计在 [l,r]，范围内 G 和 H 分别出现的次数。时间复杂度 Θ(n3)，前缀和优化后 Θ(n2)，面对 n≤5⋅105 的数据范围望而生畏。

既然打暴力行不通，那么只能考虑数学解法：

仔细观察满足条件的子串要求，发现了什么？有一个字符只出现一次！

根据这个条件，我们可以设计出合理的算法：枚举满足要求的子串中心点 si （即只出现一次的那个字符的位置）。如果它可以像左拓展至 l（即 sl−1=si），可以像右拓展至 r（即 sr+1=si），那 端点在 [l,r] 之间且经过 i 的子串（长度 len≥3）均满足要求！

最坏情况时间复杂度 Θ(n2)，预处理每个 i 的 l 和 r 后 Θ(n)，完美通过此题。

更多细节在代码中展示。

code:

#include<bits/stdc++.h>
#define int long long //注意这个测试点的答案可能无法用标准的 32 位整数型存储
using namespace std;
const int N=5e5+5;
int pre[N],nxt[N],n,ans;
signed main() {
	string s;
	cin>>n>>s;
	int preH=-1,preG=-1; //左端点初值默认-1
	for(int i=0;i<s.size();i++) { //预处理l
		if(s[i]=='H') pre[i]=preH,preH=i;
		if(s[i]=='G') pre[i]=preG,preG=i;
	}
	int nxtH=n,nxtG=n; //右端点初值默认n
	for(int i=s.size()-1;i>=0;i--) { //预处理r
		if(s[i]=='H') nxt[i]=nxtH,nxtH=i;
		if(s[i]=='G') nxt[i]=nxtG,nxtG=i;
	} 
	for(int i=0;i<s.size();i++) {
		ans+=(i-pre[i])*(nxt[i]-i)-1;
		/*根据乘法原理，端点在[l,r]之间且经过i的子串个数为左可拓展长度*右可拓展长度*/
		if(nxt[i]!=i+1) --ans; //处理长度小于3的子串
		if(pre[i]!=i-1) --ans;
	} 
	printf("%lld",ans);
	return 1;
}