加权重启自动机与下推关系研究
1. 重启转换器与下推关系
重启转换器计算的每个关系在线性有界下推关系类(lbPDR)的意义上是线性有界的。这是因为重启转换器仅在重启和接受步骤输出符号,并且对长度为 n 的输入的任何计算最多包含 n + 1 个这样的步骤。由此可知,重启转换器不能计算所有的下推关系。自然地,就产生了一个问题:它们是否至少能计算所有线性有界的下推关系?
相关研究表明,单调的 RWW - 和 RRWW - 转换器实际上刻画了准实时下推关系类(qrtPDR),即有如下定理:
定理 6
:R(mon - RWW - Td) = R(mon - RRWW - Td) = qrtPDR。
为证明该定理,给出了两个引理:
-
引理 7
:qrtPDR ⊆ R(mon - RWW - Td)
- 证明过程:设 R ⊆ Σ∗× Δ∗是由准实时下推转换器 T = (Q, Σ, Γ, Δ, δ, q0, Z0, F) 计算的关系。使用特定构造方法,用一个单调的 RWW - Td M 来模拟 T。
- 定义 l := max{ |γ| | ∃(q, a, A, p, γ, v) ∈ δ },以及 Γ ′ := Γ ′1 ∪ Γ ′2,其中 Γ ′1 := { (x) | x ∈ Γ +, |x| ≤ 2l },Γ ′2 := { (y) | y ∈ Γ 2l }。
- M 在每个周期模拟 T 的两个步骤。例如,T 对输入 w = a0a1 · · · an 的接受计算开始时,先应用转换 (q1, B1 · · · Bm1C1, v1) ∈ δ(q0, a0, Z0),然后应用 (q2, Bm1 + 1 · · · Bm1 + m2C2, v2) ∈ δ(q1, a1, C1)。由于 m1 < l 且 m2 < l,有 |B1 · · · Bm1 + m2C2| < 2l。那么 M 可以执行重写步骤 ca0a1a2 → c(xC2)a2,其中 x := B1 · · · Bm1 + m2,并产生输出 v1v2。
- 若 T 执行下一步后到达配置 (q4, a4 · · · an, B1 · · · Bm1 + m2 - 1x1),根据不同情况,M 进行相应重写。若 m1 + m2 - 1 + |x1| ≤ 2l,M 将 (xC2)a2a3a4 重写为 (x′)a4;若 m1 + m2 - 1 + |x1| > 2l,M 将 (xC2)a2a3a4 重写为 (x′)(x′′)a4。
- 对于 T 的 λ - 步骤,M 需将最多 2l 个 λ - 步骤(或几个 λ - 步骤与下一个非 λ - 步骤)组合成一个模拟步骤。
- 继续这样的过程,M 的磁带内容总是形如 α(u)aj · · · an,其中 (u) ∈ Γ ′1,α ∈ Γ ′2∗。αu 编码 T 的下推栈的当前内容,aj · · · an 是 T 仍需读取的输入后缀。只要 j < n - 1,M 就可以根据 T 的下推栈内容的修改方式,将四个符号 (xi)(xi + 1)ajaj + 1 重写为 (xi)(xi + 1)(xi + 2)、(xi)(xi + 2) 或 (xi + 2)。模拟持续到 T 拒绝(此时 M 也拒绝)或 j = n - 1。此时 M 能检测 T 是接受还是拒绝,并做出相应操作。由此可知 M 是单调的,且 Rel(M) = R。
-
引理 8
:R(mon - RRWW - Td) ⊆ qrtPDR
- 证明过程:设 M 是一个单调的 RRWW - Td。使用模拟技术可知,M 可以由一个下推转换器 T 模拟。
- 设 cuqvw$ 是 M 的接受计算中的一个重写配置,M 执行重写步骤 (q′, v′) ∈ δ(q, v) 后,下一个周期从重启配置 q0cuv′w$ 开始。由于 M 是单调的,下一个重写操作在 uv′w 的长度最多为 |vw| 的后缀内执行。
- T 将前缀 uv′ 存储在下推栈上,输入包含仍未读取的后缀 w。因为 RRWW - 转换器 M 在执行重写步骤后向右移动,且(不失一般性)仅在磁带右端重启并产生输出。T 每次模拟重写步骤时不能完全扫描输入,所以它猜测 M 在当前周期结束时产生的输出 z,并将重写步骤到达的状态 q′ 和猜测的输出 z 保存在其有限状态控制中。处理 w 中的更多字母时,T 更新状态信息。当 w 完全处理完后,T 检查存储在其有限状态控制中的 M 的所有状态是否对应重启步骤和相应的输出字符串。
- 由于 M 是单调的,很容易验证 T 是准实时的,即 T 执行 λ - 转换时会从下推栈弹出一个符号。而且,T 模拟 M 的重写步骤时,必须记住 M 通过该重写步骤进入的状态 q′ 和 M 在当前周期将产生的输出 z。由于 M 只有有限对形式为 (q′, z),T 可以将模拟计算中出现的所有对存储在其有限状态控制中。
因为 R(mon - RWW - Td) ⊆ R(mon - RRWW - Td),引理 7 和引理 8 共同推出了定理 6 的刻画。
此外,还可以证明所有线性有界下推关系都能被(非单调的)RRWW - 转换器接受:
定理 9
:lbPDR ⊆ R(RRWW - Td)
- 证明过程:设 R ⊆ Σ∗× Δ∗是一个线性有界下推关系,不妨假设 Σ 和 Δ 是不相交的。根据引理 5,R 由上下文无关语言 L ⊆ (Σ ∪ Δ)∗和两个投影 hi : (Σ ∪ Δ)∗→ Σ∗以及 ho : (Σ ∪ Δ)∗→ Δ∗强刻画。并且存在一个常数 k,使得对于所有 (u, v) ∈ R,存在一个单词 w ∈ L,使得 |w| ≤ k · |u| 且 (u, v) = (hi(w), ho(w))。设 M 是 L 的一个下推自动机,为 R 构造一个 RRWW - Td T,其处理分两步进行:
1. T 猜测 (u, v) 的一个刻画单词 w 并产生输出 ho(w)。
2. T 通过在 w 上模拟 PDA M 来验证 w ∈ L。
构造 T 的主要问题是要确保这些步骤以长度缩减的方式实现。
2. 单调加权 RWW 和 RRWW 自动机计算的关系
在前面的研究中,已经表明单调的 RWW - 和 RRWW - 转换器计算准实时下推关系类中的关系。那么,单调的(字加权)RWW - 和 RRWW - 自动机是否更具表达能力呢?
研究从分析 R(mon - wRWW) 和 R(mon - wRRWW) 这两个类之间的关系开始。定义关系 τ1 ⊆ {a, b, c}∗× {d, e}∗为:
τ1 = { (akbkcm, dmek) | k, m ≥ 1 }
-
引理 10
:τ1 ∉ R(mon - wRWW)
-
证明过程:假设 τ1 ∈ R(mon - wRWW),即存在一个加权单调 RWW - 自动机 M 和一个权重函数 ω′,使得 τ1 = Rel((M, ω′))。由于 τ1 实际上是一个(部分)函数,ω′ 可以被一个将 M 的每个转换映射到单元素集的权重函数 ω 替换,即 M = (M, ω) 是一个字加权单调 RWW - 自动机。对于形式为 akbkcm 的输入,M 首先输出 m 次符号 d,然后输出 k 次符号 e。
-
因为语言 L = { akbkcm | k, m ≥ 1 } 不是正则的,如果 k 足够大,M 在对输入 akbkcm 的所有接受计算中都需要执行重写步骤。考虑第一个重写步骤的应用位置:
- 情况 1 :假设第一个重写步骤在后缀 cm 内应用。处理这个后缀时,M 可以轻松产生输出 dm。然后 M 必须比较前缀 ak 和中缀 bk,并在此过程中产生输出 ek。但由于 M 是单调的,一个周期中重写步骤的位置的右距离不能大于前一个周期中重写步骤的右距离。因此,中缀 bk 必须通过重写缩减为适合 M 窗口的单词,这意味着 M 无法区分 bk 和 bk + r(r 为正整数)。所以,M 会接受单词 akbk + rcm,这与对 M 的假设矛盾。
- 情况 2 :由上述论证可知,第一个重写步骤必须在前缀 ak 内或在前缀 ak 和中缀 bk 的边界处执行。这意味着 M 必须首先比较音节 ak 和 bk,并且由于此过程会破坏指数 k 的信息,它必须在此过程中产生输出 ek。然而,由于输出音节 ek 之前有前缀 dm,M 必须在开始输出 e 符号之前输出音节 dm。已知 M 对长度为 n 的输入的任何计算的长度最多为 1/2(n + 2)(n + 3) - 1。选择 l ≥ 1 为常数,使得对于 M 的所有转换 t 有 |ω(t)| ≤ l,并选择 m 使得 m > (1/2(2k + 2)(2k + 3) - 1)·l。那么 M 在处理前缀 akbk 时无法产生 m 个 d 符号。所以,要么 M 在擦除所有关于 k 的信息之前停止产生 d 符号,导致产生的 d 符号不足;要么它在擦除所有关于 k 的信息的同时继续产生 d 符号,这样它将无法产生正确数量的 e 符号。
-
因为语言 L = { akbkcm | k, m ≥ 1 } 不是正则的,如果 k 足够大,M 在对输入 akbkcm 的所有接受计算中都需要执行重写步骤。考虑第一个重写步骤的应用位置:
-
证明过程:假设 τ1 ∈ R(mon - wRWW),即存在一个加权单调 RWW - 自动机 M 和一个权重函数 ω′,使得 τ1 = Rel((M, ω′))。由于 τ1 实际上是一个(部分)函数,ω′ 可以被一个将 M 的每个转换映射到单元素集的权重函数 ω 替换,即 M = (M, ω) 是一个字加权单调 RWW - 自动机。对于形式为 akbkcm 的输入,M 首先输出 m 次符号 d,然后输出 k 次符号 e。
显然,R(mon - wRWW) 包含于 R(mon - wRRWW),并且可以证明这个包含是真包含:
定理 11
:对于所有 x ∈ {w, wFIN, wword},R(mon - xRWW) ⊊ R(mon - xRRWW)
- 证明过程:由引理 10 可知 τ1 ∉ R(mon - wRWW)。另一方面,可以轻松构造一个单调的字加权 RRWW - 自动机 M = (M, ω),使得 Rel(M) = τ1。该自动机 M 的处理过程如下:
- 对于输入 w = akbkcm,在第一个周期,M 通过将前两个符号编码为一个组合(新)符号来标记 w 的前缀,然后移动到 w 的后缀 cm。扫描这个后缀时,它为遇到的每个 c 符号输出一个 d 符号,并在右端标记处重启。
- 在后续周期中,看到磁带左端的标记时,M 意识到已经产生了 d 符号。因此,它现在移动到前缀 ak 和中缀 bk 的边界进行比较。在每个后续重写步骤中,它移除一个 a 符号和一个 b 符号,并通过 ω 输出一个 e 符号。
关系 τ1 是一个线性有界下推关系,但不能由任何单调加权 RWW - 自动机计算。而另一个例子中的关系可以由一个单调字加权 RWW - 自动机计算,其定义域 a∗是上下文无关的,但其值域 { c1/2(n + 1)n | n ≥ 0 } 不是。所以有以下不可比性结果:
定理 12
:对于每个前缀 x ∈ {w, wFIN, wword},关系类 R(mon - xRWW) 与类 lbPDR 和 PDR 在包含关系上是不可比的。
最后,考虑单调 wRRWW - 自动机计算的关系类。定义关系 τ2 ⊆ {a, b, c}∗× {d, e}∗为:
τ2 = { (akbkcm + lal, dmekdmel) | k, l, m ≥ 1 }
-
引理 13
:τ2 ∉ R(mon - wRRWW)
- 证明过程:由于 τ2 是一个部分函数,如果 τ2 由一个单调 wRRWW - 自动机计算,那么它也由一个单调字加权 RRWW - 自动机 M = (M, ω) 计算。对于输入 akbkcm + lal,M 首先输出音节 dm,然后输出 ek,再次输出 dm,最后输出 el。
- 因为 M 是单调的,M 必须首先比较前缀 ak 和中缀 bk。由于在这个过程中指数 k 的信息会丢失,M 必须在此过程中产生输出音节 ek。所以,输出的前缀 dm 必须在这个过程开始之前产生,这意味着 M 在产生输出 dm 时只能对输入的前缀 ak 执行重写操作。
- m 的精确值是未知的,即 M 在向右移动穿过输入音节 cm + l 时必须猜测它。在比较 a 和 b 符号的数量并输出相应数量的 e 符号后,M 必须再次产生 m 个 d 符号,即它必须以某种方式记住这个数字。然而,在 ak 与 bk 比较之前,M 不能对后缀 cm + lal 执行任何重写步骤,所以它必须在前缀 ak 内编码数字 m。但如果 m 足够大,这是不可能的。因此,τ2 不能由任何单调加权 RRWW - 自动机计算。
由于 τ2 也是一个线性有界下推关系,结合前面的例子和引理 13,有以下不可比性结果:
定理 14
:对于每个前缀 x ∈ {w, wFIN, wword},关系类 R(mon - xRRWW) 与类 lbPDR 和 PDR 在包含关系上是不可比的。
3. 总结
通过对上述内容的研究,得到了单调加权 RWW - 和 RRWW - 自动机计算的(二元)关系类,将它们与单调 RWW - 和 RRWW - 转换器计算的关系类以及一些下推关系类进行了关联。所得的包含关系结果可以用如下 mermaid 流程图表示:
graph LR
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
PDR(PDR):::process --> lbPDR(lbPDR):::process
lbPDR --> RmonwRRWW(R(mon - wRRWW)):::process
RmonwRWW(R(mon - wRWW)):::process --> RmonwRRWW
qrtPDR(qrtPDR):::process --> RmonRWWTd(R(mon - RWW - Td)):::process
RmonRWWTd --> RmonRRWWTd(R(mon - RRWW - Td)):::process
rtPDR(rtPDR):::process --> qrtPDR
style PDR fill:#ffffff,stroke:#000000,stroke-width:2px;
style lbPDR fill:#ffffff,stroke:#000000,stroke-width:2px;
style RmonwRWW fill:#ffffff,stroke:#000000,stroke-width:2px;
style RmonwRRWW fill:#ffffff,stroke:#000000,stroke-width:2px;
style qrtPDR fill:#ffffff,stroke:#000000,stroke-width:2px;
style RmonRWWTd fill:#ffffff,stroke:#000000,stroke-width:2px;
style RmonRRWWTd fill:#ffffff,stroke:#000000,stroke-width:2px;
style rtPDR fill:#ffffff,stroke:#000000,stroke-width:2px;
具体来说,单调的 RWW - 和 RRWW - 转换器刻画了准实时下推关系类,并且单调(字)加权 RWW - 自动机的计算能力严格弱于单调(字)加权 RRWW - 自动机。这是首次证明(非确定性)单调 RWW - 自动机的一个版本与相应的(非确定性)单调 RRWW - 自动机的版本在表达能力上存在差异。不过,还需要进一步研究用其他类型的设备来刻画这些自动机计算的关系类。
综上所述,整个研究过程的关键步骤可以总结为以下表格:
| 步骤 | 内容 |
|---|---|
| 1 | 分析重启转换器与下推关系,证明单调 RWW - 和 RRWW - 转换器刻画 qrtPDR |
| 2 | 研究单调加权 RWW 和 RRWW 自动机计算的关系,通过引理和定理证明其计算能力差异和不可比性 |
| 3 | 总结各类关系之间的包含关系,绘制流程图和表格进行展示 |
加权重启自动机与下推关系研究
4. 关键概念与技术总结
为了更清晰地理解上述研究内容,下面对一些关键概念和技术进行总结:
| 概念/技术 | 解释 |
|---|---|
| 重启转换器 | 仅在重启和接受步骤输出符号,其计算的关系在线性有界下推关系类(lbPDR)意义上是线性有界的,但不能计算所有下推关系 |
| 单调 RWW - 和 RRWW - 转换器 | 刻画了准实时下推关系类(qrtPDR),通过引理 7 和引理 8 证明了相关定理 |
| 单调加权 RWW - 和 RRWW - 自动机 | 研究其计算能力和表达能力,发现单调(字)加权 RWW - 自动机计算能力弱于单调(字)加权 RRWW - 自动机,且相关关系类与 lbPDR 和 PDR 存在不可比性 |
| λ - 步骤处理 | 在模拟过程中,对于重启转换器或自动机的 λ - 步骤,需要将多个 λ - 步骤组合成一个模拟步骤进行处理 |
| 重写操作 | 根据不同情况对输入符号进行重写,以模拟下推转换器或自动机的操作,例如 M 在模拟 T 时的各种重写情况 |
5. 研究结果的实际意义
上述研究结果在理论和实际应用中都具有重要意义,以下是具体分析:
-
理论意义
- 完善自动机理论体系 :明确了单调 RWW - 和 RRWW - 转换器与准实时下推关系类的联系,以及单调加权 RWW - 和 RRWW - 自动机的计算能力差异,丰富了自动机理论的内容。
- 揭示计算能力边界 :通过证明关系类之间的不可比性,进一步明确了不同类型自动机的计算能力边界,为后续研究提供了基础。
-
实际应用意义
- 自然语言处理 :在自然语言处理中,自动机可以用于语法分析、机器翻译等任务。理解不同自动机的计算能力有助于选择合适的模型来处理自然语言的复杂结构。
- 编译原理 :在编译过程中,自动机可以用于词法分析和语法分析。研究结果可以指导编译器的设计,提高编译效率。
6. 未来研究方向
尽管已经取得了一些研究成果,但仍有许多问题值得进一步探索,以下是一些可能的未来研究方向:
- 刻画关系类的其他设备 :目前还没有用其他类型的设备来刻画单调加权 RWW - 和 RRWW - 自动机计算的关系类,未来可以研究如何用其他设备来实现这一目标。
- 自动机的优化与改进 :可以研究如何优化单调加权 RWW - 和 RRWW - 自动机的结构和算法,提高其计算效率和表达能力。
- 应用拓展 :将研究成果应用到更多领域,如生物信息学、图像处理等,探索自动机在这些领域的应用潜力。
整个研究的逻辑流程可以用如下 mermaid 流程图表示:
graph LR
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
Start(开始):::process --> Analyze(分析重启转换器与下推关系):::process
Analyze --> Prove1(证明单调 RWW - 和 RRWW - 转换器刻画 qrtPDR):::process
Prove1 --> Research(研究单调加权 RWW 和 RRWW 自动机计算的关系):::process
Research --> Prove2(证明计算能力差异和不可比性):::process
Prove2 --> Summarize(总结各类关系包含关系):::process
Summarize --> Future(探索未来研究方向):::process
style Start fill:#ffffff,stroke:#000000,stroke-width:2px;
style Analyze fill:#ffffff,stroke:#000000,stroke-width:2px;
style Prove1 fill:#ffffff,stroke:#000000,stroke-width:2px;
style Research fill:#ffffff,stroke:#000000,stroke-width:2px;
style Prove2 fill:#ffffff,stroke:#000000,stroke-width:2px;
style Summarize fill:#ffffff,stroke:#000000,stroke-width:2px;
style Future fill:#ffffff,stroke:#000000,stroke-width:2px;
综上所述,对加权重启自动机与下推关系的研究是一个具有重要理论和实际意义的领域,未来还有很多值得深入探索的方向。通过不断的研究和实践,有望进一步推动自动机理论和应用的发展。
超级会员免费看
16

被折叠的 条评论
为什么被折叠?



