加权自动机的编辑距离:概念与算法解析
1. 加权自动机与转换器基础概念
在加权自动机或转换器 $M$ 中,成功路径是指从初始状态到最终状态的路径。对于 $M$ 中的一个状态 $q$,若能从初始状态 $I$ 到达 $q$,则称 $q$ 是可达的;若能从 $q$ 到达最终状态,则称 $q$ 是可共同达的。当 $M$ 中不存在权重为 0 的转移,且所有状态既可达又可共同达时,称 $M$ 是精简的。若对于任意字符串 $x \in \Sigma^*$,最多只有一条标记为 $x$ 的成功路径,则 $M$ 是无歧义的,此时无歧义的转换器可定义一个函数。
值得注意的是,热带半环和对数半环的第二个运算及其单位元是相同的。因此,当把一个在热带半环上的自动机 $A$ 视为对数半环上的加权自动机时,或者反之,$A$ 中路径的权重不会改变。
2. 加权自动机编辑距离的定义
设 $\Sigma$ 是一个有限字母表,定义 $\Omega = \Sigma \cup {\epsilon} \times \Sigma \cup {\epsilon} - {(\epsilon, \epsilon)}$。自由幺半群 $\Omega^ $ 中的元素 $\omega$ 可以通过连接操作看作 $\Sigma^ \times \Sigma^ $ 中的元素,即 $\omega = (a_1, b_1) \cdots (a_n, b_n) \to (a_1 \cdots a_n, b_1 \cdots b_n)$。用 $h$ 表示从 $\Omega^ $ 到 $\Sigma^ \times \Sigma^ $ 的相应态射,记为 $h(\om
超级会员免费看
订阅专栏 解锁全文
21

被折叠的 条评论
为什么被折叠?



