泛化误差,偏差方差分解

训练是为了得到泛化性能好的模型,希望模型在未知数据上能够取得好的效果,偏差方差分解是解释模型泛化性能的一种方式,

对于测试样本\(x\),使用数据集\(D\)训练的模型\(f\)在\(x\)上的输出记为\(f(x;D)\),\(x\)的真实标签为\(y\),在数据集\(D\)中模型的标签为\(y_D\)。

$$\overline f(x;D) = E_D[f(x;D)]$$

偏差

偏差是指模型的期望输出与数据真实标签的差别

$$bias^2(x)=(\overline f(x;D)-y)$$

方差

$$var(x)=E_D[(f(x;D) - \overline f(x;D))^2]$$

噪声

$$\epsilon^2 = E_D[(f(x;D) - y)^2]$$

那么模型的期望泛化误差可以表示为

$$\begin{align}E_D[(f(x;D) - y_D)^2] =& E_D[(f(x;D) - \overline f(x;D) + \overline f(x;D) - y_D)^2]\\ =& E_D[(f(x;D) - \overline f(x;D))^2] + E_D[(\overline f(x;D) - y_D)^2]\\ =& E_D[(f(x;D) - \overline f(x;D))^2] +E_D[(\overline f(x;D) - y + y- y_D)^2]\\ =& E_D[(f(x;D) - \overline f(x;D))^2] +E_D[(\overline f(x;D) - y] + E_D[(y- y_D)^2]\\ =& var(x) + bias^2(x) + \epsilon^2\end{align}$$

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值