31、从正数据中对多上下文无关语言进行多项式时间识别

雪落无声360

于 2025-10-16 16:34:44 发布

阅读量12

点赞数

CC 4.0 BY-SA版权

分类专栏：语法推断：从理论到应用文章标签：多上下文无关语言多项式时间识别学习算法

本文链接：https://blog.youkuaiyun.com/agile9scrum/article/details/153802838

语法推断：从理论到应用专栏收录该内容

39 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

从正数据中对多上下文无关语言进行多项式时间识别

1. 假设

任意固定两个自然数 $p \geq 1$ 和 $r \geq 1$。学习算法 $A(p, r)$ 利用正数据和成员查询来计算 $G(p, r)$ 中的文法。设 $L^ \subseteq \Sigma^ $ 是属于 $KL(p, r)$ 的目标语言。

假设的文法由三个参数定义：$K \subseteq S^{\leq p}(L^ )$，$X \subseteq C^{\leq p}(L^ )$ 和 $L^ $。$K$ 和 $X$ 是从给定的正数据计算得到的有限集。算法 $A(p, r)$ 不能将 $L^ $ 作为输入的一部分，但实际上有限数量的成员查询足以构建以下多上下文无关文法（MCFG）$G_r(K, X, L^ ) = \langle \Sigma, V, F, P, I \rangle$：
- 非终结符集合 $V = K$，为了明确表示它是一个非终结符（用 $v$ 索引），我们将用 $[[v]]$ 代替 $v$。
- 维度 $dim([[v]]) = |v|$。
- 初始符号集合 $I = { [[\langle w \rangle]] | \langle w \rangle \in K \text{ 且 } w \in L^ }$，其中 $I$ 的每个元素维度为 1。
- 规则 $P$ 分为以下两种类型：
- （类型 I）$[[v]] \to f([[v_1]], \ldots, [[v_n]])$，如果 $0 \leq n \leq r$，$v, v_1, \ldots, v_n \in K$