基于规则的留言板主题分类方法解析
1 规则分类模块概述
在消息分类过程中,我们旨在模拟人类的推理模式。目标是在留言板中发现相关消息对,并将这些关系划分为 5 类:
- 公告消息(ANNOUNCEMENT) :因消息所谈论的事件而相关。
- 问题消息(QUESTION) :因消息提出的问题而相关。
- 提示消息(CUE) :因消息给出的建议而相关。
- 回答消息(ANSWER) :因强烈确认或否认所回复消息中的某些陈述而相关。
- 相关消息(RELATED) :因内容相关而相关。
需要注意的是,即使对于人类来说,给定消息间关系的相关类别也并非总是唯一确定的。例如,一条消息包含句子 “Did you look at the paper http://www.bibliosite/file.pdf?”,从语法形式(句末有问号)来看,它可能是问题消息;但从另一个角度看,它也可以被视为一种隐含的建议,可分类为提示消息。这种关系的潜在多重分类是选择基于规则的系统作为架构核心的动机之一。规则允许将同一对消息分配到多个类别,并为不同类别赋予不同的置信度,还能动态调整置信度值以考虑未来任何时间点可用的信息。一对消息的代表类别将是置信度较高的类别。
2 基于规则的系统介绍
2.1 基本组件
基于规则的系统具有以下基本组件:
1. 工作内存 :一组断言共同构成 “工作内存
超级会员免费看
订阅专栏 解锁全文
1641

被折叠的 条评论
为什么被折叠?



