题目略,大致意思是要从一个只含P
,A
,T
三种字符的字符串中找出为PAT
的子串,此处子串的每个字符不要求在原字符串中连续出现,只要求先后顺序不变。
初始想法是对于字符串中每个P
统计其之后的AT
的个数,也就是为每个字符A
记录该字符后T
的个数,从左到右遍历一遍数组,碰到P
就维护计数器sum
,从该位置开始扫一遍数组,碰到A
就将该字符后T
的个数累加到sum
。很显然,这种方法的复杂度是O(n2)O(n^2)O(n2),遇到大量数据时就会超时,看了题解后豁然开朗,下面就讲讲高效题解的思路。
思路
有一个字符串a1a2...ana_1a_2...a_na1a2...an,该字符串包含两个字符串PAT
,分别为s1=ai1ai2ai3,s2=aj1aj2aj3s_1=a_{i1}a_{i2}a_{i3},s_2=a_{j1}a_{j2}a_{j3}s1=ai1ai2ai3,s2=aj1aj2aj3,这两个字符串不同当且仅当i1≠j1,i2≠j2,i3≠j3i1\neq j1,i2\neq j2,i3\neq j3i1=j1,i2=j2,i3=j3中至少有一个成立,我们把同为PAT
的不同子串分成两类,第一类是i2=j2i2=j2i2=j2,第二类是i2≠j2i2\neq j2i2=j2。
对于确定的字符A
,该字符能参与组成的不同的PAT
构成第一类,个数为A
左侧的P
个数乘以A
右侧的T
个数。
第二类为不同位置的A
参与组成的PAT
。这样我们就能把问题转换为求字符串a1a2...ana_1a_2...a_na1a2...an中每个字符A
能参与组成的不同PAT
的个数的和。
实现
使用变量num_p
记录字符A
左侧的P
个数,num_t
记录字符A
右侧的T
个数,先遍历一遍字符串,得出字符串中T
的个数,接着从左到右遍历一遍字符串,碰到P
就num_p++
,碰到T
就num_t--
。
#include <iostream>
#include <cstdio>
#include <algorithm>
typedef long long LL;
#define INF 1 << 30
#define MIN(a, b) ((a) < (b) ? (a) : (b))
#define MAX(a, b) ((a) > (b) ? (a) : (b))
LL LLINF = ~(1LL << 63);
using namespace std;
int main()
{
char str[100010];
int num_p, num_t;
num_p = num_t = 0;
scanf("%s", str);
for (auto c: str)
{
if (c == '\0') break;
if (c == 'T') num_t++;
}
int ans = 0;
for (auto c: str)
{
bool exit = false;
switch (c)
{
case '\0':
exit = true;
break;
case 'P':
num_p++;
break;
case 'A':
ans = (ans + num_p * num_t) % 1000000007;
break;
case 'T':
num_t--;
default:
break;
}
if (exit) break;
}
printf("%d", ans);
return 0;
}