文本数据规则发现与分析技术
1. 电子邮件分析系统构建背景
由于难以提前描述所有主题的表达,且构建关键概念词典也颇具难度,因此构建了一个基于关键短语模式词典方法的电子邮件分析系统。该方法的优势在于无需依赖特定目标任务的词典。
2. 系统数据来源与规则发现视角
- 数据来源 :系统使用电子邮件的主题和正文内容。
- 规则发现视角 :
- 家电产品视角 :包含五个文本类别,分别为“洗衣机”“吸尘器”“冰箱”“微波炉”和“其他”。若一封邮件包含多个主题,操作员会将其分配到包含主要主题的文本类别中。
- 客户评价视角 :同样包含五个文本类别,即“问题”“请求”“建议”“投诉”和“其他”。“其他”类别涵盖如“感谢”或“评论”等客户声音的其他方面。
| 视角 | 文本类别 |
|---|---|
| 家电产品视角 | 洗衣机、吸尘器、冰箱、微波炉、其他 |
| 客户评价视角 | 问题、请求、建议、投诉、其他 |
3. 系统功能
- 分类功
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



