受控问答的总结逻辑形式技术详解
1. 领域分类图构建
领域分类图的构建有两种方式:
- 先构建分类图,再构建其近似子图。
- 先推导近似总结逻辑形式(SLF)集合,再构建其分类图。
若节点的回缩消除了被分配答案的单边路径,该答案(可能模糊地)会被分配到以合并节点结尾的另一条路径上。需注意,节点消除操作可能导致答案的非确定性合并。
2. 优化 SLF 领域以实现最优性
为了实现领域的最优性,我们需要关注一些关键的参数和操作。
- 领域质量标准 :
- 固定整体领域知识,改变获取方式。对于 SLF 领域,保留所有文本文档,但可改变其划分为答案的方式,以提供最准确的答案。
- 固定形式化程度,忽略重要性低于阈值的所有事实,仅改变重要事实组合形成 SLF 的方式。同时,固定查询表示(QR)与 SLF 的匹配机制。
- 最优性标准的定义基于所有形式化(非自然语言)查询,即语言 L(从原始关键词集 K 派生)中的格式良好的公式集。需区分实例化和非实例化公式,因为它们可形成不同的 SLF。
- 关键参数 :
- 答案可访问性(a) :定义为提供该答案的查询数量,归一化为查询总数。领域可访问性通过对所有答案的可访问性求平均得出:a = <#qa/#q>answers。此标准倾向于增加每个答案的 SLF 数量,与分离标准冲突。
- 答案精度(p) :对于查询的答案精度基于提供该答案的其他查询数量 qa。一般来说,精度 p 由
超级会员免费看
订阅专栏 解锁全文
83

被折叠的 条评论
为什么被折叠?



