66、文本数据规则发现与分析技术

文本数据规则发现与分析技术

1. 电子邮件分析系统构建背景

由于难以提前描述所有主题的表达,且构建关键概念词典也颇具难度,因此构建了一个基于关键短语模式词典方法的电子邮件分析系统。该方法的优势在于无需依赖特定目标任务的词典。

2. 系统数据来源与规则发现视角
  • 数据来源 :系统使用电子邮件的主题和正文内容。
  • 规则发现视角
    • 家电产品视角 :包含五个文本类别,分别为“洗衣机”“吸尘器”“冰箱”“微波炉”和“其他”。若一封邮件包含多个主题,操作员会将其分配到包含主要主题的文本类别中。
    • 客户评价视角 :同样包含五个文本类别,即“问题”“请求”“建议”“投诉”和“其他”。“其他”类别涵盖如“感谢”或“评论”等客户声音的其他方面。
视角 文本类别
家电产品视角 洗衣机、吸尘器、冰箱、微波炉、其他
客户评价视角 问题、请求、建议、投诉、其他
3. 系统功能
  • 分类功
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值