基于句法概念格学习上下文无关文法
1. 文法基础
我们使用上下文无关文法(CFG),标准定义为一个四元组 ⟨Σ, V, P, S⟩。其中:
- Σ 是一个非空有限集,即字母表。
- V 是一个与 Σ 不相交的有限非终结符集。
- S 是 V 中的一个特殊元素,即起始符号。
- P 是一个有限的产生式集合,形式为 V × (Σ ∪V )∗,我们写成 V →α 的形式。
我们主要考虑乔姆斯基范式(Chomsky Normal Form)的 CFG,其产生式形式为 N →a、N →λ 或 N →RS。标准推导记为 βNγ ⇒G βαγ(当 N →α ∈P 时),传递自反闭包记为 ∗⇒G。
给定一个格 B(L) 和一个有限概念集 V ⊆B(L)(包含概念 C(L)),我们可以这样定义一个 CFG:
- 非终结符集等于这个概念集,可以是与概念一一对应的符号集,也可以是概念本身。
- 起始符号是概念 C(L)。
- 产生式集合 P 的定义如下:
- 如果 N = ⟨S, C⟩ 且 a ∈Σ ∪{λ} 且 a ∈S,则添加规则 N →a。
- 如果 A ◦B ≤N,则添加规则 N →AB。我们称这个文法为 G(L, V)。
引理 1 :对于所有的 L 和所有的 V ⊆B(L),如果 N = ⟨SN, CN⟩ 且 N ∗⇒G w,那么 w ∈SN。
证明 :通过对推导长度进行归纳。
- 假设 N →w 是完整推导,根据构造可知 w ∈SN。
- 假设对于长度至多为 k 的所有推导该结
超级会员免费看
订阅专栏 解锁全文
15

被折叠的 条评论
为什么被折叠?



