#对离散特征进行分箱(特征分箱需遵循分箱后样本随分箱结果有规律变化)
def get_dispersed_result_group(data,aim,label,label_loss):
'''
data : 数据集需包括aim和label
aim : 要分组的特征名
label :标签名
label_loss : 标签的流失值,就是分箱后指定的需随结果规律变化的label值
'''
result_group = []
result_rate = []
group_lis = data[aim].value_counts().index
for group in group_lis;
need_data = data[data[aim] =
离散分箱
最新推荐文章于 2024-11-30 12:47:27 发布