字符串的近似周期研究
1. 预备知识
在开始研究字符串的近似周期之前,我们需要了解一些基本的字符串概念。
- 字符串定义 :字符串是来自字母表 $\Sigma$ 的零个或多个字符的序列。字母表 $\Sigma$ 上的所有字符串的集合记为 $\Sigma^ $,空字符串记为 $\epsilon$。字符串 $x$ 的第 $i$ 个字符记为 $x[i]$,从位置 $i$ 开始到位置 $j$ 结束的子字符串记为 $x[i..j]$。
- 前缀、后缀和子序列 :如果 $x = wu$,其中 $u \in \Sigma^ $,则称字符串 $w$ 是 $x$ 的前缀;如果 $x = uw$,则称 $w$ 是 $x$ 的后缀。如果 $w$ 是通过从 $x$ 中删除零个或多个字符(在任意位置)得到的,则称 $w$ 是 $x$ 的子序列,或者 $x$ 是 $w$ 的超序列。例如,“ace” 是 “aabcdef” 的子序列。
2. 字符串距离度量
为了衡量两个字符串之间的相似性(或距离),我们使用了不同的度量方法,主要分为绝对度量和相对度量。
- 绝对度量
- 汉明距离 :两个字符串 $x$ 和 $y$ 之间的汉明距离定义为将 $x$ 转换为 $y$ 所需的最小更改操作数。
- 编辑距离 :编辑距离定义为将 $x$ 转换为 $y$ 所需的最小更改、插入和删除操作数。
- 惩罚矩阵 :在
超级会员免费看
订阅专栏 解锁全文
980

被折叠的 条评论
为什么被折叠?



