问答系统:原理、类型与评估
1. 引言
问答(QA)系统接收用户的自然语言问题,并尝试给出精确答案,这与信息检索(IR)系统有很大不同。IR 系统接受关键词输入,返回文档排名列表。QA 系统更依赖自然语言处理(NLP)技术,如解析、命名实体检测、语义角色标注、树匹配和逻辑推理等。
QA 系统通常由多个模块组成,其端到端性能不仅取决于特定算法,还与组件的集成方式密切相关。一般来说,QA 系统结合了 IR 和 NLP 的优势。IR 技术速度快、召回率高,NLP 技术精度高但计算成本大。常见的 QA 系统配置是先使用基于搜索的组件生成可能包含答案的文档或段落列表,再用基于 NLP 的组件对这些文本进行深入分析以找到答案。
2. 问答系统可处理的问题类型
2.1 评估标准界定的范围
虽然原则上任何问题都可能是 QA 系统的处理对象,但目前学术界和工业研究实验室的 QA 系统开发往往遵循当前评估标准的要求。像 TREC(后为 TAC)评估英语 QA,NTCIR 针对亚洲语言,CLEF 针对欧洲语言(包括跨语言)等评估论坛,在一定程度上定义了该领域的实际工作范围。此外,一些政府资助机构的相关项目也推动着该领域的发展。
2.2 常见问题类型
- 事实类问题(Factoid Questions) :这类问题寻求建立事实的实体,通常由疑问词“Who”“What”“When”“Where”和有时的“How”来识别。答案类型明确,如“Who”对应人或组织,“Where”对应地点等,答案通常简短,便于判断正确性,是正式评估的主要内容。
超级会员免费看
订阅专栏 解锁全文
1329

被折叠的 条评论
为什么被折叠?



