在客户管理(CRM)的分析模式中,RFM模型是应用最广泛的模型,有三个指标:最近消费时间间隔(Recency)、消费频率(Frequency)、消费金额(Monetary)
本案例是对RFM的优化,将客户的入会时长L、消费时间间隔R、消费频率F、飞行里程M和折扣系数的平均值C五个指标作为航空公司识别客户价值指标,记为LRFMC模型。
LRMC模型解释:
步骤:
从航空公司的数据源中进行选择性抽取与新增数据抽取分别形成历史数据和增量数据。
对数据进行探索分析和预处理。
对处理完的数据进行建模,对客户群体进行特征分析,识别出有价值的客户。
针对模型结果得到不同价值的客户,采取不同的营销手段,提供定制化服务。
L=观测窗口的结束时间-入会时间(单位:月)
R=最后一次成绩时间至观测观测窗口末端时长(单位:月)
F=观测窗口内的飞行次数(单位:次)
M=累计的飞行里程=观测窗口的总飞行公里数(单位:公里)
C=平均折扣率
datafile <- read.csv('data/air_data.csv', header = TRUE)
names(datafile)
```
```{r}
# 确定要探索分析的变量
col <- c(15:18, 20:34) # 去掉类似日期、编号型的变量
# 输出变量最值、缺失情况
summary(datafile[, col])
```
```{r}
# 数据读取
datafile <- read.csv('data/air_data.csv', header = TRUE)
# 丢弃票价为空的记录
delet_na <- datafile[-which(is.na(datafile$第一年总票价) |
is.na(datafile$第二年总票价)), ]
# 丢弃票价为0、平均折扣率不为0