大三上数据挖掘,银行客户流失预警

使用Python进行数据挖掘,对银行客户流失进行预警。通过预处理数据,建立逻辑回归、K近邻和朴素贝叶斯分类器,最终发现逻辑回归模型效果最佳,平均正确率为97.98%。该模型可用于预测可能流失的客户,以便采取措施防止客户流失。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

项目描述:

首先用Excel对数据进行预处理,将英文字符替换成数字,对无关信息列删除,然后在Notekbook里面用pandas读取数据,数据格式和excel 是一样的。将前36列作为自变量想,37列的是否流失作为因变量y,并把原始数据按4:1分成训练集和测试集,再从sklearn.linear_model导入LogisticRegression模型,然后用fit(x,y)方法来拟合。用lr.score(x,y)查看模型的平均正确率。并导入confusion_matrix来画出模型的混矩阵来查看分类的整体情况,导入roc_curve画出roc曲线来查看训练出来的模型是否具有较好的分类能力。又导入了K近邻分类器(KNeighborsClassifier)和贝叶斯分类器(BernoulliNB)对训练数据进行拟合。最后比较三种分类器的得分,发现逻辑回归分类器的分数最高。接着用逻辑回归模型来对测试数据进行拟合,输出结果,查看哪些用户将要流失掉,针对这些用户制定相应对策防止流失。这个项目用到的是当时之前的sas数据分析大赛的客户流失预警的数据,当时sas比赛没有做出来,不甘心,后来用python做了一遍,体会到python的方便至极

#-*- coding: utf-8 -*-
import numpy as np
import pandas as pd
import sys
from pandas import Series, DataFrame
import matplotlib.pyplot as plt
import nltk 
import imp
# In[3]:
imp.reload(sys)
#sys.se
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值