机器学习中的方差偏差分析(Bias-variance analysis)

本文探讨了预测问题中的期望误差,并将其分解为偏差、方差和噪声三个组成部分。通过数学推导展示了如何从给定数据点出发,计算出模型的真实错误。

在预测问题中,给定一个新的数据点,预测错误的期望是多少?
假设数据是独立同分布地从一个潜在固定的概率分布中获取的,假设其分布函数为 P(&lt;x,y&gt;)=P(x)P(y∣x)P(&lt;\textbf{x},y&gt;) = P(\textbf{x})P(y|\textbf{x})P(<x,y>)=P(x)P(yx),我们的目标就是对任意给定的数据点 xxx, 求出EP[(y−h(x))2∣x],E_P[(y−h(\textbf{x}))^2|\textbf{x}],EP[(yh(x))2x],其中,y 是数据集中 x\textbf{x}x 对应的值,期望是针对所有数据集,下标 P 表示所有数据集是从同一分布 P 中获取的。形式上,该值是某一点 x\textbf{x}x 在多个数据集上的预测错误的均值(期望)。
对于给定的假设集,我们可以计算出模型的真实错误(true error),也称泛化错误、测试错误∑xEP[(y−h(x))2∣x]P(x),\sum_{\textbf{x}}E_P[(y−h(\textbf{x}))^2|\textbf{x}]P(\textbf{x}),xEP[(yh(x))2x]P(x),即为 所有数据点 在那个输入数据的潜在固定分布上的预测错误的期望。如果 x\textbf{x}x 为连续变量,则上述求和转化成积分形式。
我们接下来将把 真实错误(true error) 一分为三:真实错误 = 偏差 + 方差 + 噪声。\textbf{真实错误 = 偏差 + 方差 + 噪声。}真实错误 = 偏差 + 方差 + 噪声。
关于方差和期望的基本结论:
E[X2]=(E[X])2+Var[X]E(XY)=E(X)E(Y)+Cov(X,Y)E[X^2] = (E[X])^2 + V ar[X]\\E(XY) = E(X)E(Y) + Cov(X,Y)E[X2]=(E[X])2+Var[X]E(XY)=E(X)E(Y)+Cov(X,Y)
先做一个简单展开:
EP[(y−h(x))2∣x]&ThinSpace;=EP[(h(x))2−2yh(x)+y2∣x]&ThinSpace;=EP[(h(x))2∣x]+EP[y2∣x]−2EP[y∣x]EP[h(x)∣x],……(1) E_P[(y−h(\mathbf{x}))^2|\mathbf{x}] \\\,\\= E_P [(h(\mathbf{x}))^2 − 2yh(\mathbf{x}) + y^2|\mathbf{x}]\\\,\\=E_P [(h(\mathbf{x}))^2|\mathbf{x}] +E_P[y^2|\mathbf{x}] -2E_P[y|\mathbf{x}]E_P[h(\mathbf{x})|\mathbf{x}],……(1)EP[(yh(x))2x]=EP[(h(x))22yh(x)+y2x]=EP[(h(x))2x]+EP[y2x]2EP[yx]EP[h(x)x](1)
上式中包含三项。令 h‾(x)=EP[h(x)∣x]\overline{h}(\mathbf{x})=E_P[h(\mathbf{x})|\mathbf{x}]h(x)=EP[h(x)x],表示点 x 在不同数据集上(分布P上)预测的均值(期望),则

第一项
运用方差的结论:平方的期望=期望的平方+方差
EP[(h(x))2∣x]=(h‾(x))2+EP[(h(x)−h‾(x))2∣x]。……(2)E_P [(h(\mathbf{x}))^2|\mathbf{x}]=(\overline{h}(\mathbf{x}))^2+E_P [(h(\mathbf{x})-\overline{h}(\mathbf{x}))^2|\mathbf{x}]。……(2)EP[(h(x))2x]=(h(x))2+EP[(h(x)h(x))2x](2)
第二项
运用方差的结论:平方的期望=期望的平方+方差
EP[y2∣x]=(EP(y∣x))2+EP[(y−f(x))2∣x]E_P [y^2|\mathbf{x}]=(E_P(y|\mathbf{x}))^2+E_P [(y-f(\mathbf{x}))^2|\mathbf{x}]EP[y2x]=(EP(yx))2+EP[(yf(x))2x]
注意到 EP(y∣x)=EP(f(x)+ϵ∣x)=f(x)E_P(y|\mathbf{x}) = E_P(f(\mathbf{x})+\epsilon|\mathbf{x})=f(\mathbf{x})EP(yx)=EP(f(x)+ϵx)=f(x),其中 ϵ∼N(0,σ)\epsilon\sim N(0,\sigma)ϵN(0,σ),故上式化为
EP[y2∣x]=(f(x))2+EP[(y−f(x))2∣x]。……(3)E_P [y^2|\mathbf{x}]=(f(\mathbf{x}))^2+E_P [(y-f(\mathbf{x}))^2|\mathbf{x}]。……(3)EP[y2x]=(f(x))2+EP[(yf(x))2x](3)

将(2)(3)代入(1),得EP[(y−h(x))2∣x]&ThinSpace;=EP[(h(x))2∣x]+EP[y2∣x]−2f(x)h‾(x)&ThinSpace;=(h‾(x))2+EP[(h(x)−h‾(x))2∣x]+(f(x))2+EP[(y−f(x))2∣x]−2f(x)h‾(x)&ThinSpace;=EP[(h(x)−h‾(x))2∣x]+(f(x)−h‾(x))2+EP[(y−f(x))2∣x]。……(∗)E_P[(y−h(\mathbf{x}))^2|\mathbf{x}] \\\,\\=E_P [(h(\mathbf{x}))^2|\mathbf{x}] +E_P[y^2|\mathbf{x}] -2f(\mathbf{x})\overline{h}(\mathbf{x}) \\\,\\=(\overline{h}(\mathbf{x}))^2+E_P [(h(\mathbf{x})-\overline{h}(\mathbf{x}))^2|\mathbf{x}] \\+ (f(\mathbf{x}))^2+E_P [(y-f(\mathbf{x}))^2|\mathbf{x}] \\-2f(\mathbf{x})\overline{h}(\mathbf{x}) \\\,\\=E_P [(h(\mathbf{x})-\overline{h}(\mathbf{x}))^2|\mathbf{x}] +(f(\mathbf{x})-\overline{h}(\mathbf{x}))^2 + E_P [(y-f(\mathbf{x}))^2|\mathbf{x}] 。……(*)EP[(yh(x))2x]=EP[(h(x))2x]+EP[y2x]2f(x)h(x)=(h(x))2+EP[(h(x)h(x))2x]+(f(x))2+EP[(yf(x))2x]2f(x)h(x)=EP[(h(x)h(x))2x]+(f(x)h(x))2+EP[(yf(x))2x]()
大功告成!!!!!!!!!!!!!!!!!!!!!!!!!!!!

  • EP[(h(x)−h‾(x))2∣x]E_P [(h(\mathbf{x})-\overline{h}(\mathbf{x}))^2|\mathbf{x}]EP[(h(x)h(x))2x] 为 预测的 方差
  • (f(x)−h‾(x))2(f(\mathbf{x})-\overline{h}(\mathbf{x}))^2(f(x)h(x))2平方偏差
  • EP[(y−f(x))2∣x]E_P [(y-f(\mathbf{x}))^2|\mathbf{x}]EP[(yf(x))2x]噪声
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

颹蕭蕭

白嫖?

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值