3、机器学习与监督学习入门:模型评估与选择

机器学习与监督学习入门:模型评估与选择

1. 机器学习算法概述

在机器学习中,算法是学习模型的具体计算方法。基于训练数据集,机器学习会依据学习策略从假设空间中挑选最优模型,最后考虑采用何种计算方法来求解该最优模型。此时,机器学习问题便归结为优化问题,机器学习算法也成为解决优化问题的算法。

若优化问题存在明确的解析解,那么问题相对简单;但通常情况下,解析解并不存在,这就需要运用数值计算方法。确保找到全局最优解且求解过程高效,成为了重要课题。机器学习既可以运用现有的优化算法,有时也需要开发独特的优化算法。

机器学习方法的差异主要源于其模型、策略和算法的不同。一旦模型、策略和算法确定,机器学习方法也就随之确定,因此它们被称为机器学习方法的三要素。

2. 模型评估与选择
2.1 训练误差与测试误差

机器学习的目标是让学习到的模型对已知和未知数据都具备良好的预测能力。不同的学习方法会产生不同的模型。当损失函数固定时,基于该损失函数的模型训练误差和测试误差自然会成为评估学习方法的标准。需要注意的是,机器学习方法所使用的具体损失函数可能与评估时使用的损失函数不一致,当然,两者一致是最理想的情况。

假设学习到的模型为 $\hat{Y} = \hat{f}(X)$,训练误差是该模型在训练数据集上的平均损失:
[R_{emp}(\hat{f}) = \frac{1}{N} \sum_{i = 1}^{N} L(y_i, \hat{f}(x_i))]
其中,$N$ 是测试样本的数量。

测试误差是该模型在测试数据集上的平均损失:
[e_{test} = \frac{1

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值