基于支持向量机的客户情感分析
1. 问题提出
在电商业务中,客户可分为开心和不开心两类。开心的客户会持续访问网站并购买商品,而不开心的客户要么只是逛逛,要么花钱无度且不在乎公司,或者把钱花在其他地方。我们的目标有两个:一是确定客户的满意度是否与公司的盈利相关,二是监测客户的满意度。
然而,我们面临一个问题:如何用数值来衡量客户是否开心呢?数据库中并没有直接表明客户开心程度的字段。虽然直觉上我们知道开心的客户更有可能成为回头客,但如何去验证这一点呢?
这个问题可分为两个层次:
1. 判断客户是否开心,即他们话语中的情感是积极还是消极。
2. 整体客户情感是否与公司的盈利相关?我们通常认为开心的客户意味着更多的收入,但这真的正确吗?又该如何构建算法来验证呢?
为了解决这个两层问题,我们需要找到一种将客户与情感映射的方法。可以采用多种方式,比如将客户聚类成两组,使用KNN算法找出与已知开心或不开心客户最近的邻居,或者使用支持向量机(SVM)。
2. 使用SVM进行情感分类
要映射整体客户情感,首先需要数据。我们有一个支持系统,可以导出客户撰写的数据。对于那些多次在支持系统中与我们沟通的客户,可通过以下方式判断他们是否开心:
- 让支持人员为每张工单标记情感(积极或消极)。
- 让支持人员标记部分工单(如所有工单的X%)。
- 使用现有的标记数据库(如电影评论或一些学术数据集)。
在数据收集方面,虽然这里使用学术数据集作为示例,但通常让一组人标记部分数据是解决此问题的正确方法。在实际操作中,我们希望以最少的工作量获得最佳结果,也就是为问题获取一组可靠的基础
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



