Problem Address
Solution
Trie
树 +
BFS
- 把询问的
RNA
片段建成一颗
Trie
树,然后通过类似在
Trie
树 “走” 来求出答案,这个过程用
BFS
实现。
- 考虑在广搜的队列节点上记录两个值:
Q[][0]
表示在
Trie
树上走到的点,
Q[][1]
表示当前匹配到模板片段的位置;
- 然后我们考虑怎样扩展队列节点和计算答案:(为了描述方便,记
u=Q[][0],v=Q[][1]
,模板串为
s
,点u沿字典树边为
c
走到的点为G[u][c])
- 当
s[v+1]=′A′or′T′or′C′or′G′
时:可扩展节点{
G[u][′A′or′T′or′C′or′G′],v+1
};
- 当
s[v+1]=′?′
时:因为可以代替任意字母,可同时扩展节点{
G[u][′A′and′T′and′C′and′G′],v+1
};
- 当
s[v+1]=′∗′
且
′∗′
不代替字符时:可扩展节点{
u,v+1
};
- 当
s[v]=′∗′
且
′∗′
代替多个字符时:将每代替一个字符都看成扩展一次队列上的节点,则每次可同时扩展节点 {
G[u][′A′and′T′and′C′and′G],v
}(即这次匹配到的位置仍不改变,下次则可同样继续扩展);
- 直到某个节点上匹配到了模板串结尾,统计
Trie
树节点
u
上存在的RNA片段数量。
Notice
- 通过一个
bool
数组
vis[x][y]
,记录走到节点
x
匹配到位置y的状态已经出现过,避免了不必要的搜索 (这里
bool
数组得用
bitset
,不然会
MLE
)。
- 应避免匹配到模板片段的位置大于原串长度或者在
Trie
树上走到的点为空,在扩展节点时进行特判。
Code
#include <cstdio>
#include <cstring>
#include <bitset>
using namespace std;
const int Maxn = 0x3f3f3f3f;
const int N = 505, L = N << 1, M = L * 350;
int T = 1, n, Ans, len, t = 0, w = 1;
int G[M][4], val[M], Q[M][2];
char s[L], a[N], c[255];
bitset<L> vis[M];
inline int get()
{
char ch; bool f = false; int res = 0;
while (((ch = getchar()) < '0' || ch > '9') && ch != '-');
if (ch == '-') f = true;
else res = ch - '0';
while ((ch = getchar()) >='0' && ch <= '9')
res = (res << 3) + (res << 1) + ch - '0';
return f? ~res + 1 : res;
}
inline void put(int x)
{
if (x < 0)
x = ~x + 1, putchar('-');
if (x > 9) put(x / 10);
putchar(x % 10 + 48);
}
inline void Ins()
{
scanf("%s", a + 1); int l = strlen(a + 1), x = 1;
for (int i = 1; i <= l; ++i)
{
int y = c[a[i]];
if (!G[x][y]) G[x][y] = ++T;
x = G[x][y];
}
val[x]++;
}
inline void Push(const int x, const int stp)
{
if (!x || stp > len) return;
if (!vis[x][stp])
{
vis[x][stp] = 1; w = (w + 1) % M;
Q[w][0] = x; Q[w][1] = stp;
}
}
int main()
{
c['A'] = 0; c['C'] = 1; c['T'] = 2; c['G'] = 3;
c['?'] = -1; c['*'] = -2;
scanf("%s", s + 1); len = strlen(s + 1);
s[0] = '?'; n = get();
for (int i = 1; i <= n; ++i) Ins();
int u, v, I; Q[1][0] = 1; Q[1][1] = 0; vis[1][0] = 1;
while (t != w)
{
t = (t + 1) % M;
u = Q[t][0]; v = Q[t][1];
if (s[v] == '*')
for (int i = 0; i < 4; ++i) Push(G[u][i], v);
if (v == len) {Ans += val[u]; val[u] = 0; continue;}
if (c[s[v + 1]] >= 0) Push(G[u][c[s[v + 1]]], v + 1);
else
{
for (int i = 0; i < 4; ++i) Push(G[u][i], v + 1);
if (s[v + 1] == '*') Push(u, v + 1);
}
}
return put(n - Ans), 0;
}