航空公司客户价值分析(上)

该博客探讨了如何使用LRFMC模型(增加客户关系长度和平均折扣系数)对航空公司的客户价值进行识别。通过K-Means聚类方法,对数据进行预处理,包括数据清洗、属性规约,处理缺失值和异常值,以建立客户分类模型。案例基于《Python数据分析与挖掘实战》一书,并提供了相关代码和数据集。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本案例来自《Python数据分析与挖掘实战》一书,相关数据集可以在本书的电子资料中找到,下面的一些内容很多都是吸收了书上的内容然后加以改变。简单的介绍一下挖掘的背景与目标,挖掘的背景就是航空公司面临着客户流失、竞争力下降等问题,目标是需要建立一个合理的客户价值评估模型,对客户进行分类区分有价值客户与无价值客户,从而来重新分配资源。
本次项目的全部代码和数据集均在Github上有。
数据集在data目录下,air_data.csv。

分析方法

本次案例的目标是客户价值识别,即通过航空公司客户数据来识别不同价值的客户。识别客户价值应用的最广泛的模型是RFM模型,即通过Recency(最近消费时间间隔),Frequency(消费频率),Monetary(消费金额)来进行客户划分。本案例则是通过在此基础上再加上两个指标来训练模型,即是LRFMC模型,增加的两个指标为:L(客户关系长度)、C(平均折扣系数)。本次是运用聚类的方法对客户群进行分类,采用的聚类算法是K-Means方法。

数据探索

本次的数据探索主要是对数据进行缺失值分析与异常值分析,目的是为了分析出数据的规律以及异常值。查找每列属性观测值中空值个数、最大值、最小值,代码如下:

import pandas as pd
#读取数据
input_file = '../data/air_data.csv'
output_file = '../tmp/explore.xls'
data = pd.read_csv(input_file,encoding='utf-8')
explore = data.describe(percentiles=[],include='all')
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值