
特征工程
文章平均质量分 64
大范先生
这个作者很懒,什么都没留下…
展开
-
有关项目:预测贷款用户是否逾期的特征处理
这是对前一个项目:预测贷款用户是否逾期的数据进行提前准备工作,即特征处理,主要包括数据类型转换和缺失值处理。 一、特征处理 对拿到的金融数据进行直观分析,删除无关特征,避免过拟合 # 删除无关信息 dataset = dataset.drop(["custid","trade_no","bank_card_no","id_name","first_transaction_time","lates.原创 2018-11-22 18:52:33 · 1823 阅读 · 0 评论 -
特征筛选———贷款用户是否会逾期
一、学习要求 分别对前面预处理的数据使用IV值和随机森林进行特征筛选 二、基础知识 1、IV值 计算过程是根据该特征所命中黑白样本的比率与总黑白样本的比率,来对比和计算其关联程度 IV 值的取值范围是[0, ∞ ),但一般具有中等IV值的变量来进行模型开发,如下所示 IV值 预测能力 <0.02 无用 0.02-0.1 弱预测 0.1-0.3 中等预测 0.3-...原创 2018-11-29 10:23:19 · 422 阅读 · 0 评论