KBQA知识问答概述

本文概述了问答系统的历史,从基于模板到基于知识库的演进,包括Wolfram Alpha等成果。内容涵盖问答形式分类、评测指标、基于深度学习的方法、传统问答技术及知识图谱问答的需求与挑战。讨论了模板生成、匹配与实例化的步骤,并涉及实体识别和属性检测技术。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

问答系统历史:基于模板的问答专家系统----->基于信息检索的问答----->基于社区的问答----->基于知识库的问答(受益于维基百科等)

问答形式分类:一问一答,交互式问答,阅读理解。

现有的成果: Wolfram Alpha;答题机器人:日本的‘多达一’高考答题机器人、863:基于大数据的类人智能关键技术与系统;

评测数据集:1.QALD,知识库问答测评。QALD的测评指标:准确率、召回率和F值

2.WebQuestions(5810个问题)

3.FREE917

基于深度学习的问答方法:基于分布式表示(DL)的知识库问答;LSTM、attentionModel、memory network。

问句与答案计算相似度

传统的问答方法:符号表示;基于关键词、逻辑表达式、文本蕴含推理。

问句短语:

wh—短语:who  、when、where、what、which、why、how

wh+名词(形容词,副词):which shool ,how long

问答质量评估原则:相关度、正确度、精炼度、完备度、简单度、合理度

答案评估:正确、错误,不完全

问答系统基本组件:数据预处理,问题分析,数据匹配,查询创建,排序,结果生成与返回

答案的处理:抽取、组合、摘要、推理

基于知识图谱的问答的基本需求:支持自然语言问句查询,支持多种问题方式,准确率覆盖率高,维护代价低、查询速度快、面对大数据可扩展性好。

技术挑战:如何将问题映射到答案

基于模板的问答:TBSL架构

step1:模板生成:

步骤:获取自然语言问题的POStag信息---->基于POStag信息,语法规则表示问句---->利用domian-dependent词汇和domian-independent词汇来辅助分析问题------>最后将语义转化为一个SPARAQL模板

step2:模板匹配与实例化,实体识别与属性检测:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值