【论文笔记】Large-scale Semantic Parsing without Question-Answer Pairs

本文探讨了一种新的方法,通过将自然语言陈述句转化为无根图并映射到Freebase查询图,实现大规模语义解析,无需依赖问题-答案对。论文介绍了从语料库学习、无根图构建到与知识库图匹配的全过程,并利用平均感知器算法进行学习和优化。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

背景


  • 什么是Freebase(什么是知识库):
    • Curated KBs知识库是由结构化的三元组(entity, relation/property, entity)所表达的知识组成的知识库,如果把这个三元组用起点-边-终点来表示,这个知识库就可以被表示为指示图。代表:Freebase
    • Extracted KBs知识库则是直接从网页中抽取实体关系三元组所组成的知识库,这样的知识更多是自然语言的形式表达的,涉及到entity linking 和 relation extraction两大关键技术。
  • 什么是KB-QA:
    给定自然语言问题,通过对问题的语义理解,进而利用知识库进行查询、推理以得出答案。特别地,和对话机器人的交互式对话不同,KB-QA的答案是知识库中的实体或者实体关系或者是no answer。
  • 基于语义分析的KB-QA:
    思路:自然语言表示的问题 —-(语义分析)—->逻辑表达式——>数据库查询语句——>得到结果
  • 一点思考:
    1. 语义分析的基本思路就是将自然语言问题转化成Freebase上的查询语句,那么容易想到这种转化方式有很多种,直观的思路比如通过实体识别(entity recognition)来识别出句子中的实体,再在知识库中查找相应的实体以及它们所连接的其它实体,通过学习算法对这些连接的其它实体是问题答案的可能性进行评分,选择最高的几种作为答案;
    2. 而传统的一种办法是采用已有的PARSER来得到语义分析结果(逻辑形式Logic Form,可以表达为lambda演算式),比如CCG等,再考虑如何将这种语义分析结果转化为具体的查询语句;而带有逻辑形式标注的自然语言问句比较难,所以不满足数据集规模的要求,因此出现了通过Question-Answer pair来作为学习的数据,逻辑形式因此隐含于其中;
    3. 今天要做的这篇论文用到的办法是将图结构作为语义分析的结果,再和FREEBASE中的图结构进行匹配来得到相应的答案。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值