OptBinning 特征分箱包使用介绍
OptBinning:支持数值型和分类型的最大IV分箱,并可保证分箱单调性,同事方便处理缺失值。作为一个分箱包还是挺好用,这里简答介绍了这个包中OptimalBinning和fit_transform的参数。
1、使用案例
import pandas as pd
from sklearn.datasets import load_breast_cancer
# 数据准备
data = load_breast_cancer()
df = pd.DataFrame(data.data, columns=data.feature_names)
variable = "mean radius"
x = df[variable].values
y = data.target
from optbinning import OptimalBinning
optb = OptimalBinning(name=variable, dtype="numerical"

最低0.47元/天 解锁文章
2058





