9、机器学习中的学习原理与环境约束

机器学习中的学习原理与环境约束

1. 环境约束概述

在机器学习领域,智能体需要在一个以约束满足为特征的环境中运行。我们期望机器能够满足环境约束的数学概念,大多数机器学习关注监督学习的特殊情况,但更广泛的视角建议对约束进行扩展,以便对当前问题的先验知识进行解释和利用。

1.1 分类与回归任务

监督学习可分为分类任务和回归任务:
- 分类任务 :当目标值 (Y \subset {-1, +1}^n) 时,学习任务为分类任务。
- 回归任务 :当目标值 (Y \subset R^n) 时,学习任务为回归任务。

这两种任务在监督学习中需要不同的处理方式。在回归任务中,通常希望 (y - f(x)) 接近零,经典的二次损失是衡量预测误差的常用方法。例如在自动驾驶中,机器需要使 ((y - f(x))^2) 尽可能小。而在分类任务中,真正重要的是 (yf(x)) 的符号一致性。当 (yf(x) < 0) 时,表明决策错误,此时应返回损失。

此外,损失还可能依赖于训练集中的特定点 (x)。例如在手写字符识别中,(\alpha_c(x) = x’m_c / (|x| \cdot |m_c|)) 的值可用于调整监督强度。当 (\alpha_c(x)) 接近 1 时,对应的损失可以设置得较小。

1.2 损失函数的定义

形式上,任何满足 (f(x) = y) 时 (V(x, y, f) = 0)(一致性)的函数 (V : X \times Y \times H^k(X) \to R^+ \cup {0}) 被称为损

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值