[JSOI2007]文本生成器(AC自动机+dp)

题意

nnn 个单词,现在要生成 mmm 个字母的文本,问至少出现一个单词的文本有多少种。
n≤60,m≤100,∣si∣≤100n\leq 60,m\leq 100,|s_i|\leq 100n60,m100,si100
sis_isi 只包含大写英文字母。

分析

这算是一道很典型的 ACACAC 自动机上 dpdpdp 的题目。
答案就是用 26m26^m26m 减去一个单词都没出现过的。现在我们求一下后面的东西。
fi,jf_{i,j}fi,j 表示长度为 iii,来到节点 jjj 的方案数。
那么如果 trj,ktr_{j,k}trj,k 不是末尾节点,就可以转移到 trj,ktr_{j,k}trj,k
初始条件 f0,0=1f_{0,0}=1f0,0=1
总复杂度是 O(26n∣s∣m)O(26n|s|m)O(26nsm)

代码如下

#include <bits/stdc++.h>
#include<ext/pb_ds/hash_policy.hpp>
#include<ext/pb_ds/assoc_container.hpp>
using namespace __gnu_pbds;
using namespace std;
typedef long long LL;
typedef unsigned long long uLL;
struct custom_hash {
	   static uint64_t splitmix64(uint64_t x) {
	   	x += 0x9e3779b97f4a7c15;
		x = (x ^ (x >> 30)) * 0xbf58476d1ce4e5b9;
		x = (x ^ (x >> 27)) * 0x94d049bb133111eb;
		return x ^ (x >> 31);
	}
	size_t operator()(uint64_t x) const {
		static const uint64_t FIXED_RANDOM = chrono::steady_clock::now().time_since_epoch().count();
		return splitmix64(x + FIXED_RANDOM);
	}
};
LL z = 1;
int read(){
	int x, f = 1;
	char ch;
	while(ch = getchar(), ch < '0' || ch > '9') if(ch == '-') f = -1;
	x = ch - '0';
	while(ch = getchar(), ch >= '0' && ch <= '9') x = x * 10 + ch - 48;
	return x * f;
}
int ksm(int a, int b, int p){
	int s = 1;
	while(b){
		if(b & 1) s = z * s * a % p;
		a = z * a * a % p;
		b >>= 1;
	}
	return s;
}

const int mod = 1e4 + 7, N = 6e3 + 5;
int f[105][N], ch[N][26], fail[N], v[N], cnt;
char s[N];

void insert(char *s){
	int i, p = 0, c, n = strlen(s);
	for(i = 0; i < n; i++){
		c = s[i] - 'A';
		if(!ch[p][c]) ch[p][c] = ++cnt;
		p = ch[p][c];
	}
	v[p] = 1;
}

void get_fail(){
	int i, a;
	queue<int> q;
	for(i = 0; i < 26; i++) if(ch[0][i]) q.push(ch[0][i]);
	while(!q.empty()){
		a = q.front(); q.pop();
		for(i = 0; i < 26; i++){
			if(ch[a][i]) v[ch[a][i]] |= v[ch[fail[a]][i]], fail[ch[a][i]] = ch[fail[a]][i], q.push(ch[a][i]);//一定要更新 v[ch[a][i]]! 
			else ch[a][i] = ch[fail[a]][i];
		}
	}
}

int main(){
	int i, j, k, n, m, ans;
	n = read(); m = read();
	
	for(i = 1; i <= n; i++){
		scanf("%s", s);
		insert(s);
	}
	get_fail();
	ans = ksm(26, m, mod);
	f[0][0] = 1;
	for(i = 0; i <= m; i++){
		for(j = 0; j <= cnt; j++){
			for(k = 0; k < 26; k++){
				if(!v[ch[j][k]]){
					f[i + 1][ch[j][k]] = (f[i + 1][ch[j][k]] + f[i][j]) % mod;
				}
			}
		}
	}
	for(i = 0; i <= cnt; i++) ans = (ans - f[m][i]) % mod;
	printf("%d", (ans + mod) % mod);
	return 0;
}
# P4052 [JSOI2007] 文本生成器 ## 题目描述 JSOI 交给队员 ZYX 一个任务,编制一个称之为“文本生成器”的电脑软件:该软件的使用者是一些低幼人群,他们现在使用的是 GW 文本生成器 v6 版。 该软件可以随机生成一些文章——总是生成一篇长度固定且完全随机的文章。 也就是说,生成的文章中每个字符都是完全随机的。如果一篇文章中至少包含使用者们了解的一个单词,那么我们说这篇文章是可读的(我们称文章 $s$ 包含单词 $t$,当且仅当单词 $t$ 是文章 $s$ 的子串)。但是,即使按照这样的标准,使用者现在使用的 GW 文本生成器 v6 版所生成的文章也是几乎完全不可读的。ZYX 需要指出 GW 文本生成器 v6 生成的所有文本中,可读文本的数量,以便能够成功获得 v7 更新版。你能帮助他吗? 答案对 $10^4 + 7$ 取模。 ## 输入格式 第一行有两个整数,分别表示使用者了解的单词总数 $n$ 和生成的文章长度 $m$。 接下来 $n$ 行,每行一个字符串 $s_i$,表示一个使用者了解的单词。 ## 输出格式 输出一行一个整数表示答案对 $10^4 + 7$ 取模的结果。 ## 输入输出样例 #1 ### 输入 #1 ``` 2 2 A B ``` ### 输出 #1 ``` 100 ``` ## 说明/提示 #### 数据规模与约定 对于全部的测试点,保证: - $1 \leq n \leq 60$,$1 \leq m \leq 100$。 - $1 \leq |s_i| \leq 100$,其中 $|s_i|$ 表示字符串 $s_i$ 的长度。 - $s_i$ 中只含大写英文字母。 为什么WA了(过了样例): ```cpp #include <bits/stdc++.h> using namespace std; const int MOD = 1e4 + 7; const int MAX_N = 100; const int LENGTH = 10050; int n, m, trie[LENGTH][26], tot; int fail[LENGTH], dp[MAX_N][LENGTH]; bool vis[LENGTH]; void insert(string s) { int cur = 0; for (char ch : s) { int i = ch - &#39;A&#39;; if (!trie[cur][i]) trie[cur][i] = ++tot; cur = trie[cur][i]; } vis[cur] = true; } void build_fail() { queue<int> q; for (int i = 0; i < 26; i++) if (trie[0][i]) q.push(trie[0][i]); while (!q.empty()) { int cur = q.front(); q.pop(); vis[cur] |= vis[fail[cur]]; for (int i = 0; i < 26; i++) if (trie[cur][i]) { fail[trie[cur][i]] = trie[fail[cur]][i]; q.push(trie[cur][i]); } else trie[cur][i] = trie[fail[cur]][i]; } } int main() { cin >> n >> m; for (int i = 1; i <= m; i++) { string s; cin >> s; insert(s); } build_fail(); dp[0][0] = 1; for (int i = 0; i < n; i++) for (int j = 0; j <= tot; j++) for (int k = 0; k < 26; k++) if (!vis[trie[j][k]]) dp[i + 1][trie[j][k]] = (dp[i + 1][trie[j][k]] + dp[i][j]) % MOD; int ans = 1; for (int i = 1; i <= n; i++) ans = ans * 26 % MOD; for (int i = 0; i <= tot; i++) ans = (ans - dp[n][i]) % MOD; cout << (ans + MOD) % MOD << &#39;\n&#39;; return 0; } ```
最新发布
08-02
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值