2020-12-25 Kmeans

KMEANS

 

【提示】
这个案例的目标是客户价值识别,即通过航空公司客户数据识别不同价值的客户。识别客户价值应用最广泛的模型是通过三个指标(最近消费时间间隔(Recency)、消费频率(Frequency)、消费金额(Monetary))进行客户细分,识别出高价值的客户,也即 RFM 模型。
在 RFM 模型中,消费金额表示在一段时间内,客户购买该企业产品金额的总和。但考虑到商用航空行业与一般商业形态的不同,我们选择客户在一定时间内累积的飞行里程 M和客户在一定时间内乘坐舱位所对应的平均折扣率两个指标代替消费金额。此外,考虑航空公司会员入会时间的长短在一定程度上能够影响客户价值,所以在模型中增加客户关系长度L,作为区分客户的另一指标。

 

 

观测发现SEG_KM_SUM和AVG_DISCOUNT有部分缺失值,但是相对样本数量3000相对来说量不是很大,可以考虑进行删除。进入到数据加工界面,选中相应的字段进行删除。对结果集进行保存。对新构造的LRFMC变量进行异常值检测。检测发现异常值较多,考虑到可能是真实数据,本着谨慎的原则不进行删除,让其参与模型运算。

 

 

 

选择聚类算法(K-means 或其他聚类方法)进行客户细分 (4 分) :
使用K-means方法对客户进行聚类。
讨论轮廓系数; (5 分)
根据轮廓系数大小确定 K 值得到聚类结果。 (4 分)
从下图可知,轮廓系数在分类为2的时候最高,但是从业务的角度来说需要进行更精细的分群,2类有点少,由下图可知分为4类或者5类效果也还可以。按题意由于本题是要利用RFM 模型对客户价值进行分析,所以这里我们选择5类。
(对于预处理和聚类分析过程逻辑清晰且解释完整额外+2 分)

 

 

 

重要保持客户:
这类客户的平均折扣率C较高,一般所乘航班的舱位等级较高,最近乘坐过本公司的航班R低,乘坐的次数F或里程M较高。这类客户是航空公司的高价值客户,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值