机器学习之模型调优(一)诊断、调试、系统设计

本文介绍了机器学习模型调优的重要性,包括为何需要调优步骤,详细探讨了机器学习诊断法、调试方法和系统设计。诊断法通过分析偏差和方差来确定模型问题,如欠拟合或过拟合。调试涉及多项式次数选择、正则化λ调整等。学习曲线用于判断模型的偏差和方差,指导数据集和特征选择。最后,强调了构建学习算法的步骤和数据在机器学习中的关键作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

为什么要有模型调优步骤

比如说我们针对某一个数据集选用了线性回归或者逻辑回归,又或者是神经网络等等的其中一种算法,训练好了一个模型,但是在用测试集数据进行测试的时候,我们的模型表现的并不是很好。那么此时,我们应该做什么?
是直接更换一种模型?
是尝试更多的训练样本?
是减少更多的特征?
还是加入更多的特征?
我们想到了很多的方法对模型进行调试,或者是更换模型,那么选择哪一种方式呢?
在众多的方式中最快捷的选出最有效的一种调优方式,是一个优秀程序员能力的体现。所以,我们需要知道,模型调优的步骤。

机器学习诊断法

我们再遇到上述的,模型在测试集表现不佳的情况下,不应该盲目的随机选择一种调优方式去做,有可能适得其反,并且浪费时间。
我们运用机器学习诊断法来帮助诊断模型到底是出了什么样的问题,然后对模型做出有针对的调优。

诊断法

诊断法其实就是一种测试方法,通过执行这种测试,能够深入了解我们现在所选择算法而建立起来的模型,是否对于这份数据集是有用的。通常,也能告诉我们,想要对这一模型进行调优,什么样的尝试,才是有意义的。

诊断偏差和方差

当我们训练好的模型在测试集表现的不好的时候,多半分为两种情况:要么是偏差比较大,要么是方差比较大。偏差指的是我们的测试集数据中,真实值和预测值之间的差距,差距越大,偏差越大,也就是我们在拟合模型中的欠拟合问题;方差指的是拟合曲线的波动程度,当方差很大时,我们可以想象,我们模型拟合出的曲线是一条尽量去贴合每一个样本点的样子,方差越大,表示波动程度也越大,表示在训练集上拟合了尽可能多的样本点,但是失去了泛化能力,以至于模型在测试集上表现得不尽如人意,这也是过拟合问题。
所以,如果模型在诊断中是高偏差,低方差的类别,那么这属于欠拟合问题;如果模型在诊断中是低偏差,高方差的类别,那么这属于过拟合问题。

评估假设函数(预测值)

假设函数也就是我们说的样本的预测值。通过

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值