摘自刘汝佳:不难想到这样的递推法:令d(i)表示从字符i开始的字符串(即后缀S[i..L])的分解方案数,则d(i)=sum{d(i+len(x))|单词x是S[i..L]的前缀}。
如果先枚举x,再判断它是否为S[i..L]的前缀,时间无法承受(最多可能有4000个单词,判断还需要一定的时间)。可以换一个思路,先把所有单词组织成Trie,然后试着在Trie中“查找”S[i..L]。查找过程中每经过一个单词结点,就找到一个上述状态转移方程中的x,最多只需要比较100次就能能找到所有的x。
代码如下:
#include <cstdio>
#include <cstring>
#include <cstdlib>
#include <cmath>
#include <queue>
#include <stack>
#include <list>
#include <vector>
#include <map>
#include <algorithm>
#define LL long long
#define LLU unsigned long long
#define INF 0x7fffffff
#define MOD 20071027
using namespace std;
#define M 300005
#define S 4005
#define W 105
#define maxnode 400005
#define sigma_size 30
char text[M], word[W];
int d[M], len[S];
struct Trie{
int ch[maxnode][sigma_size];
int val[maxnode];
int sz;
void clear() { sz = 1; memset(ch[0], 0, sizeof(ch[0])); }
int idx(char c) { return c-'a'; }
void insert(char *s, int v)
{
int u = 0, n = strlen(s);
for(int i = 0; i < n; ++i)
{
int c = idx(s[i]);
if(!ch[u][c])
{
memset(ch[sz],0,sizeof(ch[sz]));
val[sz] = 0;
ch[u][c] = sz++;
}
u = ch[u][c];
}
val[u] = v;
}
void search(char *s, int len, vector<int> &q)
{
int u = 0;
for(int i = 0; i < len; ++i)
{
int c = idx(s[i]);
if(!ch[u][c]) return;
u = ch[u][c];
if(val[u]!=0) q.push_back(val[u]);
}
}
}T;
int main ()
{
int s, k = 0;
while(~scanf("%s",text))
{
T.clear();
scanf("%d",&s);
for(int i = 1; i <= s; ++i)
{
scanf("%s",word);
len[i] = strlen(word);
T.insert(word,i);
}
memset(d,0,sizeof(d));
int lenth = strlen(text);
d[lenth] = 1;
vector<int>q;
for(int i = lenth-1; i >= 0; --i)
{
q.clear();
T.search(text+i,lenth-i,q);
for(int j = 0; j < (int)q.size(); ++j)
{
d[i] += d[i+len[q[j]]];
d[i] %= MOD;
}
}
printf("Case %d: %d\n", ++k, d[0]%MOD);
}
return 0;
}