从正数据中对多上下文无关语言进行多项式时间识别
1. 假设
任意固定两个自然数 $p \geq 1$ 和 $r \geq 1$。学习算法 $A(p, r)$ 利用正数据和成员查询来计算 $G(p, r)$ 中的文法。设 $L^ \subseteq \Sigma^ $ 是属于 $KL(p, r)$ 的目标语言。
假设的文法由三个参数定义:$K \subseteq S^{\leq p}(L^ )$,$X \subseteq C^{\leq p}(L^ )$ 和 $L^ $。$K$ 和 $X$ 是从给定的正数据计算得到的有限集。算法 $A(p, r)$ 不能将 $L^ $ 作为输入的一部分,但实际上有限数量的成员查询足以构建以下多上下文无关文法(MCFG)$G_r(K, X, L^ ) = \langle \Sigma, V, F, P, I \rangle$:
- 非终结符集合 $V = K$,为了明确表示它是一个非终结符(用 $v$ 索引),我们将用 $[[v]]$ 代替 $v$。
- 维度 $dim([[v]]) = |v|$。
- 初始符号集合 $I = { [[\langle w \rangle]] | \langle w \rangle \in K \text{ 且 } w \in L^ }$,其中 $I$ 的每个元素维度为 1。
- 规则 $P$ 分为以下两种类型:
- (类型 I)$[[v]] \to f([[v_1]], \ldots, [[v_n]])$,如果 $0 \leq n \leq r$,$v, v_1, \ldots, v_n \in K$
超级会员免费看
订阅专栏 解锁全文
41

被折叠的 条评论
为什么被折叠?



