文本与语音基础:知识问答、自动摘要、语音识别及案例分析
1. 基于知识的问答系统
基于知识的问答系统采用语义方法,通过语义解析将问题映射到综合数据库上的关系查询。数据库可以是关系数据库或关系三元组(如主语 - 谓语 - 宾语)的知识库,像 DBpedia 或 Freebase 这类能捕捉现实世界关系的知识库。
- DBpedia 介绍 :它是一个免费的语义关系数据库,从多种语言的维基百科页面中提取了 460 万个实体,包含超过 30 亿个以资源描述框架(RDF)格式表示的关系三元组,常被视为语义网(即链接开放数据云)的基础,自 2007 年首次发布后,通过众包更新不断发展。
基于知识的方法适用于高级的开放域问答应用,因为能引入知识库形式的外部信息,但会受限于知识库的既定关系。
2. 自动推理
近期的问答系统开始引入自动推理(AR),以突破基于知识系统的语义关系限制。自动推理是人工智能领域,探索计算机系统在溯因、概率、空间和时间推理方面的方法。问答系统可通过创建一组一阶逻辑子句,增强用于支持答案假设的语义关系和证据集合。Prolog 是维护这组子句常用的声明式语言方法。
- IBM Watson 的 DeepQA :它结合了多种基于信息检索、基于知识和自动推理的方法,利用约 100 种不同方法和知识库来源生成候选答案,经证据评分和合并后,在 2011 年的《危险边缘》游戏中超越人类表现。此后,IBM 将其应用于多个领域,成效不一。
- 问答系统性能指标
超级会员免费看
订阅专栏 解锁全文
1452

被折叠的 条评论
为什么被折叠?



