28、机器学习中的模型验证、选择与优化

机器学习中的模型验证、选择与优化

1. 机器学习的学习本质与潜在问题

机器学习算法能够从数据中学习。例如,一些简单的算法在接触与结果相关的示例后,能有效估计类别或数值,这是通过归纳学习的过程,即从具体示例中提取通用规则。就像人类从小通过观察示例、推导规则并应用到新情况一样,如看到有人触火被烧伤,就知道火危险。

但使用机器学习算法通过示例学习存在一些陷阱:
- 示例数量不足,无法对规则做出判断。
- 接触到错误示例,导致无法正确推理。
- 即使示例正确且数量足够,由于规则过于复杂,算法仍无法找出规则。

数据的数量、质量以及学习算法的特性决定了机器学习应用能否很好地推广到新情况。作为数据科学从业者,必须认识并避免这些陷阱。

2. 模型拟合问题

模型拟合意味着从数据中学习生成数据的规则表示。从数学角度看,拟合模型类似于通过观察函数的输出结果来猜测未知函数。在机器学习中,期望算法根据提供的示例生成数学公式,重要的是这些公式能产生准确预测。

在选择学习算法时,需要考虑以下方面:
1. 该学习算法是否是最能近似数据背后未知函数的算法,需要考虑其在当前数据上的表现,并与其他算法的替代公式进行比较。
2. 学习算法的特定公式相对于隐藏函数是否过于简单,导致估计偏差(偏差问题)。
3. 学习算法的特定公式相对于要猜测的隐藏函数是否过于复杂,导致预测不稳定(方差问题)。

并非所有算法都适用于所有数据问题,如果数据不足或存在错误信息,某些公式可能难以找出真实函数。

3. 理解偏差和方差

如果所选学习算法不能从数据中正

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值