字符串子序列数量与近似周期的研究
字符串子序列数量的边界研究
在字符串处理领域,确定从固定大小字母表上长度为 $n$ 的字符串中删除 $t$ 个符号可得到的子序列数量是一个重要问题。这一研究与从足够多子序列重建二进制字符串的高效算法相关,也与 Levenshtein 距离的应用有联系,Levenshtein 距离在“能够纠正替换和同步错误的块码研究”中起着核心作用。
问题定义
- 相关概念 :
- L - 字符串 :字母表 $L$ 上的字符串,$|L| = s$,$L_n$ 表示所有长度为 $n$ 的 $L$ - 字符串的集合。
- 系列 :相同符号的最大连续段,$\tau(X)$ 表示字符串 $X$ 中的系列数量。
- 子序列 :从字符串 $X$ 中删除 0 个或多个符号得到的字符串 $Y$,$X$ 称为 $Y$ 的超序列。$D_t(X)$ 表示从 $X$ 中恰好删除 $t$ 个符号可得到的子序列集合。
- 已有研究 :Calabi 证明了特定字符串形式能达到 $|D_t(X)|$ 的最大值,并找到了该最大值的生成函数表达式。Levenshtein 证明了对于任何二进制字符串 $X$,有 $\binom{\tau(X) - t + 1}{t} \leq |D_t(X)| \leq \binom{\tau(X) + t - 1}{t}$,这些边界可推广到 $
超级会员免费看
订阅专栏 解锁全文
21

被折叠的 条评论
为什么被折叠?



