3.1EDA和数据描述: 探索性数据分析

EDA即数据探索,是对数据的初步分析。

包括:

  • 每个候选预测变量 的统计特性和分布
  • 候选预测变量和状态变量之间,以及预测变量相互间是否存在相关性
  • 检测缺失值和极端值,评估其对结果模型的冲击
  • 调查候选变量中的分布情况,如正常和违约的分布情况

 

实践中,以上步骤即:

  • 对每个变量的单变量描述性统计
  • 评估每个变量值的分布并检验正态假设
  • 极端值的识别和处理
  • 缺失值的计算和处理
  • 关键变量的列联表以及这些表格中统计量的计算
  • 变量间关联性指标的计算 

转载于:https://www.cnblogs.com/jane-lau/p/8458332.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值