问答系统基本概念
-
问答系统的目标:给定一个问题, 能够得到简短、精确的答案.
系统定义:一个能回答任意自然语言形式问题的自动机。 -
处理流程:
- 分析问题.
- 检索包含答案的数据(检索数据).
- 提取答案.
-
对应流程中的三个过程有三个研究的基本问题:
- 问题分析:如何去分析问题;
- 信息检索:如何根据问题的分析结果去缩小答案 可能存在的范围;
- 答案抽取:如何从可能存在答案的信息块中抽取答案。
-
问答系统的分类:
- 在问题维度:问答系统可以分为限定领域(指系统能接受的问题只 能是关于某个特定的主题)的问答系统和开放领域 (指系统能接受的问题可以是任意主题的问题, 没 有任何限制)的问答系统.
- 在数据维度:问答系统可以分为处理结构数据(或半结构数据)的问答系统 (例如关系数据)和处理无结构数据(例如文本)的问答系统.
- 在答案维度:问答系统可以分为抽取式