问答系统的历史与架构:从封闭到开放的演进
1. 问答系统发展概述
问答系统(QA)的发展历程经历了多个阶段。早期的问答系统主要通过将自然语言问题转化为SPARQL/SQL查询,从知识库或数据库中寻找答案。这类系统具有较高的置信度和准确性,但由于知识库和数据库的局限性,无法回答不同领域的问题。
为了使问答系统独立于特定领域,研究人员尝试从文本中提取答案。虽然这一代系统克服了领域依赖问题,但面临着准确性的挑战。从网页等非结构化数据中寻找答案需要自然语言处理、信息检索、信息提取和文本挖掘等多种技术,使得系统变得复杂。
近年来,新的知识库的发展促使研究人员回归到使用结构化数据回答问题的阶段。不过,这一次不会出现早期系统的问题,因为知识源的数量比以前更广泛,利用现有的链接开放数据为开发基于知识库的开放领域问答系统提供了可能。综合考虑文本问答(TextQA)和基于知识库的问答(KBQA)的优势,研究人员开始探索结合两者资源的下一代问答系统。
2. 基于结构化数据的封闭领域系统
早期开发的问答系统都基于结构化数据,且局限于特定领域。以下是一些早期的封闭领域问答系统:
- BASEBALL(1963) :这是最早的问答系统之一,用于回答用户关于棒球比赛的日期、地点和结果的问题。它将输入问题分析并转换为规范形式,然后生成查询并在结构化数据库上执行。例如:
- “Who did the Red Sox lose to on July 5?”
- “How many games did the Yankees play in July?”
- “On how many days i
超级会员免费看
订阅专栏 解锁全文
291

被折叠的 条评论
为什么被折叠?



