上下文无关文法学习与句法概念格
1. 引言
近年来,语法推理已从正则语言的可学习性研究转向上下文无关语言的推理研究。Clark 和 Eyraud 提出的方法是一个活跃的研究方向,他们考虑定义非终结符对应语言同余类的上下文无关文法,并证明了可替换语言类的可学习性结果。尽管这个语言类较小,但该结果意义重大,且已引发了许多扩展研究。
然而,纯同余方法存在严格的局限性。虽然它涵盖了许多标准语言,如 Dyck 语言等,但仍有许多简单语言不在此类别中。例如语言 $L2 = {a^nb^n|n \geq 0} \cup {a^nb^{2n}|n \geq 0}$,这显然是一个上下文无关语言。通过泵引理可以证明,该语言的任何上下文无关文法都必须有一个非终结符能生成无限个形如 ${a^{p + qn}b^{qn}|n \geq 0 \land (p + qn) \geq 0}$ 的字符串,且这些字符串彼此不同余。此外,由于该语言本身是无限多个同余类的并集,因此无法使用纯同余类方法学习。同样,由 ${a, b}$ 上所有奇数和偶数长度回文组成的语言,任意两个不同字符串都不同余,基于同余的方法也会失效。
在相关工作中,一些研究转向了更强大的上下文敏感表示,或者基于剩余格理论的方法。这些工作受语言学问题的启发,因为上下文无关语言被认为不足以处理自然语言语法。但在其他非语言学领域,语法推理也很重要,出于外部原因,可能需要将表示限制为上下文无关文法。而且,上下文敏感表示在生成和随机变体方面存在问题,而这些问题在上下文无关文法领域已得到较好理解。因此,研究上下文无关文法在各种范式下的可学习性仍然很有价值。
问题在于如何在保持上下文无关文法表示的同时,使用相同的分布技术来增加可学习的上下文无
超级会员免费看
订阅专栏 解锁全文
2321

被折叠的 条评论
为什么被折叠?



