基于支持向量机(SVM)的客户情感分析
1. 问题提出
在电商领域,客户可分为开心和不开心两类。开心的客户会持续访问网站并购买商品,而不开心的客户要么只是浏览商品不购买,要么把钱花在其他地方。我们的目标有两个:一是确定客户的开心程度是否与公司的盈利相关;二是对客户的开心程度进行监测。
然而,目前存在一个问题:如何用数值来表示客户是否开心呢?数据库中并没有关于客户开心程度的字段。虽然直觉上我们知道开心的客户更有可能持续购买,但如何验证这一点呢?这个问题可分为两个层次:
1. 判断客户是否开心,即他们话语中的情感是积极还是消极。
2. 整体客户情感是否与公司的盈利相关。
我们通常认为开心的客户意味着更多的收入,但这是否真的正确呢?又该如何构建一个算法来验证这一点呢?
为了解决这个两层级的问题,我们需要找到一种将客户与情感进行映射的方法。有多种途径可以解决这个问题,例如将客户聚类成两组,使用K近邻(KNN)算法找到已知开心或不开心客户的最近邻,或者使用支持向量机(SVM)。
2. 使用SVM进行情感分类
要映射整体客户情感,首先需要有数据。我们有一个支持系统,可以导出客户撰写的数据。对于那些多次在支持系统中给我们留言的客户,如何判断他们是否开心呢?可以采用以下方法:
- 让支持人员为每张工单标记情感(积极或消极)。
- 让支持人员标记部分工单(所有工单的X%)。
- 使用现有的标记数据库(如电影评论或一些学术数据集)。
2.1 数据收集
虽然这里使用学术数据集作为示例,但通常让一组人标记部分数据是解决这个问题的正确方法。在实际操作
超级会员免费看
订阅专栏 解锁全文
2636

被折叠的 条评论
为什么被折叠?



