机器学习随记【day19-day20】

多读书好嘛

已于 2022-02-10 20:16:30 修改

阅读量617

点赞数

CC 4.0 BY-SA版权

文章标签：机器学习

于 2022-02-10 19:45:51 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/ztyLOVElearning/article/details/122867648

本文探讨了数据集分割、模型选择和评估的重要性，强调了训练集、验证集和测试集的合理分配。介绍了线性回归和逻辑回归，并讨论了正则化在控制模型偏差和方差中的作用。通过学习曲线分析，展示了高偏差和高方差问题，提出了解决欠拟合和过拟合的策略，帮助读者理解如何选取合适的正则化参数以提高模型的泛化能力。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

评估假设

分割数据集，典型比例为7：3，通常先打乱再分割，下标m表示样本来自测试集
在这里插入图片描述
线性回归

逻辑回归

模型选择

用训练集训练出来的模型再训练集上不能预测出其对于新样本的泛化能力，因此把数据集分成训练集、验证集、测试集，典型为6：2：2

诊断偏差与方差

在这里插入图片描述

在这里插入图片描述

正则化与偏差、方差

在这里插入图片描述
如何选取合适的正则化参数

代价函数不用加正则化项

尝试不同参数，用交叉验证误差最小的之后可以用测试集来评估

学习曲线

数据用的越多，泛化性能越好，所以J_cv递减
数据越多，想对每一个样本都很好的拟合越困难，所以J_train递增
画出学习曲线有助于了解你算法可能处于的情况
在这里插入图片描述
高偏差
事实上，一个学习算法有高偏差，随着m增加，两曲线趋平，且相等，此时再增加数据也没有太大的意义

高方差

欠拟合(λ较大)会产生高偏差；过拟合(λ较小)过产生高方差

解决

在这里插入图片描述

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。