模型适应性中的数据与模型漂移检测技术
1. 模型性能与监督漂移检测策略
在模型评估中,PWPAE 模型展现出了卓越的性能,其准确率达到了 99.06%,超越了其他模型,如 Hoeffding Tree (HT) 和 Leveraging Bagging (LB) 模型。为了更好地监控模型性能,我们可以采用一些监督漂移检测策略,这些策略在有实际预测反馈时,会结合预测结果生成误差指标。
1.1 统计方法
统计方法有助于我们比较和评估两个不同的分布。通过使用散度因子或距离度量,我们可以测量不同时间点上两个分布之间的差异,从而及时检测模型的性能指标,并找出导致变化的特征。
1.1.1 Kullback–Leibler 散度
Kullback–Leibler (KL) 散度,也称为相对熵,用于量化一个概率分布与另一个概率分布的差异程度。其数学公式为:
$KL(Q||P) = -\sum P(x) * log(\frac{Q(x)}{P(x)})$
其中,$Q$ 是旧数据的分布,$P$ 是新数据的分布,$||$ 表示散度。当 $P(x)$ 高而 $Q(x)$ 低时,散度会很高;反之,当 $P(x)$ 低而 $Q(x)$ 高时,散度也会较高,但不会太高;当 $P(x)$ 和 $Q(x)$ 相似时,散度则较低。
以下代码展示了如何创建一个均值为 5、标准差为 4 的 (P, Q, M) 分布的 KL 散度图:
x = np.arange(-10, 10, 0.001)
q = norm.pdf(x, 5, 4)
plt.titl
超级会员免费看
订阅专栏 解锁全文
1316

被折叠的 条评论
为什么被折叠?



