遇到处理等深分箱 深度不为整数的处理方法
N = [1, 2, 3, 4, 5, 6]
bins = 4
那么我们划分的深度 就是 depth = N/bins = 1.5>0
每个分箱给约1.5,这里其实可以进行拆分
将 1 划给第一个分箱 [1], 将剩余的 0.5 给下一个分箱子,这样下一个分箱就有 1.5 + 0.5 = 2 个数可取 ,也就是说 [2,3] 划给了第二个分箱,后面的处理也一样,这样我们就能得到完整的分箱:[1], [2, 3], [4], [5, 6]
以上depth不为整数的划分,depth为整数就比较好划分了
如果bins = 3 那么 depth = N/3 = 2
则每个分箱会获取到两个数据。
划分结果:[1, 2], [3, 4], [5, 6]

博客介绍了等深分箱中深度不为整数的处理方法。当划分深度depth不为整数时,可将整数部分划给当前分箱,剩余小数部分给下一个分箱;当depth为整数时,每个分箱获取相同数量的数据,并给出了具体示例及部分结果参考链接。
2万+

被折叠的 条评论
为什么被折叠?



