支持(子)顺序转换器规范化和最小化的一类通用幺半群
1. 引言
顺序转换器为表示将单词映射到单词、实数,或更一般地,映射到任意幺半群元素的函数提供了一种自然且有效的方式。它还便于对单词进行高效的在线处理,使其成为自然语言建模中极具吸引力的形式化工具。本文主要探讨与顺序转换器相关的两个经典问题:规范化和最小化。
规范化的顺序转换器能提供当前明确界定的最大输出部分。在自由幺半群和热带幺半群的特殊情况下,该问题已有相关研究,并提出了有效的解决算法。本文将规范转换器的概念推广到任意幺半群。具体而言,考虑幺半群元素上的预序关系 (a \leq b) 当且仅当 (b = ac) 对于某个 (c) 成立。在这种概念下,幺半群中多个元素的最长公共开头可转化为这些元素的下确界。
顺序转换器的最小化问题是找到一个与给定转换器等价且状态尽可能少的顺序转换器。在自由幺半群和实数加法的情况下,该问题已得到深入研究,并且有成熟的高效算法。这些算法可视为对规范顺序转换器应用经典确定性自动机最小化算法的改进。因此,能够对顺序转换器进行规范化,也就有可能对其进行最小化。不过,幺半群中的可逆元素会带来一些复杂情况,本文将展示如何解决这些问题。
本文定义了一类幺半群,对于这类幺半群,规范化和最小化问题在算法上是可处理的。这类幺半群具有以下五个性质:
1. 左消去律和右消去律;
2. 在 (\leq) 关系下为下半格;
3. 有上界的元素对也有最小上界;
4. (b \leq c) 且 (b \leq ac) 意味着 (b \leq ab)。
2. 预备知识
- 幺半群