可解释性的单调约束与模型调优
在机器学习中,为了提升模型的可解释性,我们需要对特征工程和模型调优进行深入的研究。下面将详细介绍特征工程的相关操作以及如何对 Keras 神经网络进行调优。
1. 特征工程
1.1 特征离散化
对于连续特征,如年龄(age),我们可以采用不同的离散化方法。
- 等宽离散化 :也称为固定宽度区间,区间大小由 (max(x) - min(x)) / N 确定,其中 N 是区间数量。
- 等频离散化 :也称为四分位数离散化,确保每个区间的观测值数量大致相同。
以下代码展示了如何使用这两种方法进行离散化并绘制概率进展图:
mldatasets.plot_prob_progression(recidivism_df.age,
recidivism_df.is_recid, x_intervals=7,
use_quartiles=False,
title='Probability of Recidivism by Age Discretized in Fix-Width Bins', xlabel='Age')
mldatasets.plot_prob_progression(recidivism_df.age,
recidivism_df.is_recid, x_intervals=7,
use_quartiles=True,
t
超级会员免费看
订阅专栏 解锁全文
32

被折叠的 条评论
为什么被折叠?



