多语言语义解析在问答系统中的应用探索
1. 模型基础与目标设定
在多语言语义解析用于问答系统的研究中,有两个关键的模型层,分别是 L2KB 模型和 QC(Query Construction)层。
L2KB 模型的目标函数聚焦于计算推断出的实体链接与黄金标准 SPARQL 查询中的实体链接之间的重叠度。具体操作流程如下:
1. 对所有生成的状态按照目标得分进行排序。
2. 选取得分最高的 k 个状态传递到下一个采样步骤。
3. 在下一次迭代中,对这 k 个状态进行推理。
4. 重复这个过程 m 次,从而得到一个从底层因子图定义的分布中采样得到的状态序列 (s0, …, sm)。
QC 层主要负责查询构建,其提案生成包括将 QueryVar DUDES 类型的赋值分配给类词(特别是限定词)对应的节点,这些节点能够填充具有未满足参数的父节点的参数位置。该层的目标函数用于衡量推断出的 SPARQL 查询与黄金标准 SPARQL 查询之间的(图)相似度。
为了更好地理解 QC 层的工作原理,以问题 “Who created Wikipedia?” 为例,其输入状态和采样状态如图 1 所示:
初始状态中,Slot 1 被分配给了 dobj 边。而在右侧的提案状态中,参数槽 2 被分配给了 nsubj 边,并且 QueryVar DUDES 类型被分配给了节点 “Who”。这对应着以下的表示和 SPARQL 查询:
v:- vs:{y
超级会员免费看
订阅专栏 解锁全文
4581

被折叠的 条评论
为什么被折叠?



