银行客户违约信息分析(数据挖掘)

本文分析了银行客户违约信息,通过数据探索、清洗、特征选择,运用决策树、随机森林和AdaBoost分类模型进行比较。结果显示,AdaBoost模型准确率较高,达0.7725。数据清洗时删除异常值并填充缺失值,特征选择中发现信用卡负债、其他负债等具有相关性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、摘要
“data.xsl”文件中的数据是某银行收集到的客户违约信息,现设待分析的因变量是违约,其他变量是可能影响客户是否违约的因素。本文对数据进行了数据探索,对数据的基本情况、相关性进行了一定的分析;数据清洗使用了填充、取均值、删除异常值的方法;利用绘制热力图选择了合适的特征向量;最后,采用决策树、若决策数、AdaBoost分类模型进行比较分析并比较几种分类方法的准确率。AdaBoots分类模型的准确率比较高。

二、实验内容
1、数据探索模块:
(1)将xls文件转换为csv文件
在这里插入图片描述

(2)了解数据表的基本情况,包括行数、列数、每列的数据类型、数据完整度;
代码:
在这里插入图片描述

运行结果:

在这里插入图片描述
在这里插入图片描述

(3)了解数据表的统计情况;统计违约与不违约客户数量并绘制柱状图;
代码:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

今天不熬夜!

你的鼓励将是我创作的最大动力~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值