客户数据的RFM分析与聚类方法
在数据处理过程中,数据丢失是一个常见的问题。为了避免这种情况,我们可以将处理好的数据保存为CSV文件,方便后续继续处理。以下是保存客户RFM(Recency, Frequency, Monetary Value)数据的代码:
#We now have a clean file with customers and their RFM values.
#(recency, frequency, monetary value)
#To save time in the future, we will write this to a csv.
write.csv(customer_rfm, 'D:/Data/customer_rfm.csv')
数据分析方法概述
完成数据处理后,我们可以对数据进行分析。这里将采用六种不同的分析技术,虽然有些冗余,但能展示不同的数据分析方式:
1. 帕累托原则
2. k-means聚类
3. k-medoid聚类
4. 层次聚类
5. 手动聚类
重温帕累托原则
帕累托原则指出,80%的销售额由20%的客户贡献。我们的数据与这一原则的契合度如何?又如何确定哪些客户贡献了80%的销售额呢?可以将这个概念分解为以下步骤:
1. 计算80%销售额的临界值。
2. 按货币价值从大到小对数据框进行排序。
3. 创建一个列,包含货币价值的累积和。
4. 如果累积和小于临界值,则将客户标记为“Top 20”;如果大于临界值,则标记为“Bo
超级会员免费看
订阅专栏 解锁全文
6

被折叠的 条评论
为什么被折叠?



