python之信贷风险数据分析及逻辑回归预测,sklearn特征工程

本文汇总了使用Python进行信贷风险数据分析的案例,涉及LendingClub数据建模,通过sklearn进行特征工程,包括数据预处理、缺失值处理、编码方法以及逻辑回归模型的构建和评估。探讨了特征选择、降维技术,并分享了相关资源链接。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近看的一些风险信贷相关的一些写的比较详细的博客,还有使用sklearn进行特征工程的博客,单纯的进行简单整理和记录,详细的可以点击链接。

1.Python案例分析之客户信贷预测模型

来自 https://blog.youkuaiyun.com/weixin_43656359/article/details/104683553
文章发布于2020-3-14

该网页中内容主要介绍了客户信贷预测的一般流程,主要包括数据清洗、建模、预测三部分,使用的数据集是Lending club平台的业务数据,共有52个变量,39522条记录。
详细步骤如下:

  1. 对数据集中缺失率超过一半的列进行剔除
  2. 样本中对银行评定是否放贷并没有任何影响,与预测没有关系的标签,结合实际情况进行剔除。
  3. 去掉标签中只有一种属性的列
  4. 对数据进行LabelEncoder 或者OneHotEncoder编码
  5. 处理缺失值,对于缺失量不是很多的数据,可以直接去掉缺失值所在的行。对于缺失量比较多的数据,说明该数据存在的问题,再将该特征进行删除
  6. sk-learn库不接受字符型的数据,将特征中的字符型数据进行处理,该部分使用了get_dummies(),get_dummies就是OneHotEncoder类型编码。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值