本体高效受控语言设计
1. 范畴语法
范畴语法(CGs)是一类(或一类家族)词汇化语法,与当前使用的大多数受语言学启发的形式语法一样,词汇承载了关于单词如何组合形成语法结构的大部分信息。在这个框架中,句法范畴被视为公式,其范畴形成运算符被视为连接词,即逻辑常量。此外,柯里 - 霍华德对应确保了句法范畴的(逻辑)演算与一阶意义表示(FO MRs)之间的蒙塔古同态,也就是语法 - 语义接口。
CGs 的独特之处在于,单词组合是通过自然演绎逻辑规则进行的,这些规则处理自然语言的句法。这些自然演绎规则通过柯里 - 霍华德对应与处理一阶意义组合的 λ - 演算操作相结合,通过中间的 λ - FO 形式主义,即扩展了(类型化)λ - 演算的 λ - 抽象和 λ - 应用的一阶逻辑。这样,CGs 比其他等效的语法形式主义,如语义丰富的上下文无关语法或某些简单的确定子句语法,更能优雅地捕捉自然语言及其片段的句法和语义之间的紧密对应关系。
这种形式主义的这一方面显著简化了实现任务,因为只需要关注词汇的构建,并可以依赖任何现有的演算解析器。关于单词可能出现的句法结构及其意义的信息都存储在词汇中。作为推导或逻辑演绎规则,我们使用(非结合)拉姆贝克演算的无积版本。
1.1 定义句法范畴
句法范畴 A 定义如下:
[
A \rightarrow np \mid n \mid s \mid A_1\backslash A_2 \mid A_2/A_1
]
其中 (np)(名词短语)、(n)(名词)和 (s)(完整句子)是原子范畴。复杂范畴是通过方向左和右功能连接词 (\backslash) 和 / 从原子范畴构建的。我们用
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



