自然语言查询的语义分析与验证
1. 自然语言数据库概述
自然语言数据库(NLDB)是面向对象数据库(OODB)的一种转换形式。它包含了一个词汇表,以及继承和引用关系。
1.1 词汇表
自然语言查询由两部分组成:疑问词和短语。短语是名词组(NG)和动词组的连续组合。名词组在自然语言查询中由一个或多个有意义的词构成,这些词可以是与应用相关的名词、动词或值。
- 与应用相关的名词 :与OODB中的类名、简单属性或复合属性名相匹配。每个与应用相关的名词在OODB中表示为一个变量,其名称根据命名约定可能有意义,但不一定与自然语言中的词相同。每个变量对应一个词族,包含该词的所有屈折形式和同义词集。例如,“ENSEIGNANT”(教师)对应的词族包括“enseignant (ms) [teacher]”、“enseignants (mp) [teachers]”、“enseignante (fs) [teacher]”、“enseignantes (fp) [teachers]”等屈折形式,以及“maitre”等同义词。
- 动词 :查询中的动词表达两个类之间或一个类与其属性之间的联系,通常为及物动词。每个创建的动词对应共轭形式和同义词集。例如,“habiter”(居住)的共轭形式有“habite (s) [lives]”、“habitant (p) [live]”,同义词有“résider”、“demeurer”等。
- 值 :查询中的值是简单属性的实例,通过与数据库请求者的对话来识别。如果属性被数据库管理员指定为键,则其值为键值;否则为非键值。
超级会员免费看
订阅专栏 解锁全文
1219

被折叠的 条评论
为什么被折叠?



