- 博客(2)
- 收藏
- 关注
原创 变量分箱
变量分箱 变量分箱是把连续变量划分为多个分段后,计算每一分段里面的正样本比率、负样本比率,然后利用两个比率相除求得的值作为该箱的新值。 从划分变量所采用方法来划分,分为等频分箱、等距分享和卡方分箱。 等频分箱是指根据样本集变量值顺序排序后,按给定的每箱样本个数相等来划分变量的值域,然后计算每箱的woe值作为代表该箱的值。 等距分箱是指按照变量值域的大小,按给定距离划分值域,然后计算每一个划分的woe值作为代表该箱的值。 卡方分箱是一个遍历递归的过程,从样本最小或最大的样本值开始,大于样本值的作为本层递归的一
2021-04-30 00:07:33
1218
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人