机器学习经典算法：模型的泛化

最新推荐文章于 2025-09-29 09:58:08 发布

原创

最新推荐文章于 2025-09-29 09:58:08 发布 · 1.2k 阅读

·

26

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器学习 #算法 #人工智能

正文

1、过拟合与欠拟合

对于包含噪音的数据集，进行数据拟合的时候，总能找到一条曲线穿过所有样本点，使得模型的预测结果与给定训练集内的样本真实标签完全一致，取得极低的预测误差；但这意味着算法所训练的模型过多的表达了数据之间的噪音关系，称为 过拟合(over fitting)。欠拟合(under fitting) 则表明算法所训练的模型不能完整表述数据关系。
则如果模型拟合程度不高，意味着模型没有很好地捕捉到数据特征，从而也不能够很好地用于生产环境。在多项式回归预测分析中，选择过高或过低的幂来构造特征，就会产生欠拟合和过拟合的问题。

2 模型泛化能力

模型的泛化能力（generalization ability） 指的是训练出来的模型对新样例的预测能力。如果预测效果非常差，称模型的泛化能力弱。一个好的算法模型需要拥有较强的的泛化能力。这也是模型训练和测试的意义需要将原始采样数据拆分出 训练集 和 测试集 来训练和评估模型的泛化能力。

两种不同的算法模型的 模型泛化能力评估 简单的可使用在测试集上的 均方误差 (MSE = $∑i=1m(y(i)−y(i)^)2\sum_{i=1}^{m}{(y^{(i)} - \hat {y^{(i)}})^{2}}$

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

倪桦 有帮助的话请杯咖啡吧，谢谢！

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。