浅谈一下bias与variance

Hey Kids!!!

已于 2022-03-28 15:44:11 修改

阅读量1.2k

点赞数 1

文章标签：机器学习深度学习

于 2022-03-28 15:20:03 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/SaintTsy/article/details/123793057

版权

本文解释了模型的偏差与方差概念，分析了简单模型易出现高偏差低方差（欠拟合），而复杂模型则易出现低偏差高方差（过拟合）的现象，并探讨了背后的原因。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

bias是偏差

variance是方差

我们可能听过对于简单的model，其bias会大但是variance会小；复杂的model，其bias会小，但是variance会大。

具体为什么会发生这样的情况，这边我讲一下自己的理解。

所谓偏差就是你训练出一堆model，这些model的数学期望（均值）与最准确model的差距。

所谓方差就是你训练的每一个model离你这些model的数学期望的差距——即数学上定义的离散度

首先来说一下为什么简单的model，其bias会大

因为你越简单的model就表明你的拟合能力，即能产生出来的函数数量是有限的

举个例子：你设定你的model是y = wx，但是真实的model y = w1x + w2x^2

简单的model能产生的model函数范围小，完全有可能不包含真正的model所以bias会大

因为你设定的model是一次的，你无论怎么改变w的值都不可能让函数多出二次项来

其次来说一下为什么复杂的model，其bias会小

我们知道越复杂的model，拟合能力越强

举个例子：y = w1x + w2x^2 + w3x^3 + w4x^5

其函数空间是包含5次即以下的函数的，意味着我拿五次函数可以模拟一次函数二次函数的模型等

因为model足够复杂所以真正的model函数是包含在内的所以bias会小。

然后再聊一下方差的问题

方差是表示数据离散程度的量，那为什么模型的复杂程度会和数据的离散程度挂钩？

我的理解是：

模型越复杂每个点之间的关系就越复杂，就距离上来说一次函数描绘两个点之间的连线一般都是直线，但是当变成二次函数两个点之间的连线就变弯曲了也就是路径变长了。
模型越复杂表明其不确定性增加，不确定性增加说明信息熵变大，也就是数据之间的关系变的复杂了，复杂导致多样性增加，也就是更离散了。

举个例子：

由此：

简单的model，其bias会大但是variance会小——这就是欠拟合；

复杂的model，其bias会小，但是variance会大——这就是过拟合

有兴趣的同学可以看看这个科普一下：）

如何理解“方差越大信息量就越多”？ - 知乎

博客等级

码龄5年

11
原创

42
点赞

129
收藏

7
粉丝

关注

私信

热门文章

最新评论

c++：在函数‘_start’中：(.text+0x20)：对‘main’未定义的引用
XiaXia7777: 还真是，愚蠢如我......
numpy.empty用法详解
ALBERT JERRY STERLING: 使用`np.random.randint(0,20,(5,4))`可以直接创建一个形状为(5,4)、元素值在[0,20)范围内的随机整数数组。这种方法适用于需要立即获得具有确定值的数组的情况。而`np.empty(shape)`函数用于创建一个指定形状（例如`(5,4)`）的未初始化的数组。这意味着数组中的每个元素都是随机的，取决于内存的当前状态。使用`np.empty`的目的主要在于数组初始化的效率。当你只需要数组的结构（形状），而不关心其初始值时，`np.empty`可以比其他初始化方法（如`np.zeros`或`np.ones`）更快地创建数组。之后，你可以根据需要填充或覆盖这些随机值。简而言之，`np.empty`在以下情况下更有用： 1. 当你需要快速初始化一个大型数组，但随后会立即用其他值填充或覆盖这些初始值时。 2. 当初始化数组值的成本较高或不必要时，使用`np.empty`能够节省时间。
numpy.empty用法详解
亚瑟不要沉默: 好问题
c++：在函数‘_start’中：(.text+0x20)：对‘main’未定义的引用
TAuwolf: 查了半天资料结果是因为没保存对新手真不友好
c++：在函数‘_start’中：(.text+0x20)：对‘main’未定义的引用
睡不醒的王同学: 确实,保存完就可以了

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。