机器学习中的学习原理与环境约束
1. 环境约束概述
在机器学习领域,智能体需要在一个以约束满足为特征的环境中运行。我们期望机器能够满足环境约束的数学概念,大多数机器学习关注监督学习的特殊情况,但更广泛的视角建议对约束进行扩展,以便对当前问题的先验知识进行解释和利用。
1.1 分类与回归任务
监督学习可分为分类任务和回归任务:
- 分类任务 :当目标值 (Y \subset {-1, +1}^n) 时,学习任务为分类任务。
- 回归任务 :当目标值 (Y \subset R^n) 时,学习任务为回归任务。
这两种任务在监督学习中需要不同的处理方式。在回归任务中,通常希望 (y - f(x)) 接近零,经典的二次损失是衡量预测误差的常用方法。例如在自动驾驶中,机器需要使 ((y - f(x))^2) 尽可能小。而在分类任务中,真正重要的是 (yf(x)) 的符号一致性。当 (yf(x) < 0) 时,表明决策错误,此时应返回损失。
此外,损失还可能依赖于训练集中的特定点 (x)。例如在手写字符识别中,(\alpha_c(x) = x’m_c / (|x| \cdot |m_c|)) 的值可用于调整监督强度。当 (\alpha_c(x)) 接近 1 时,对应的损失可以设置得较小。
1.2 损失函数的定义
形式上,任何满足 (f(x) = y) 时 (V(x, y, f) = 0)(一致性)的函数 (V : X \times Y \times H^k(X) \to R^+ \cup {0}) 被称为损
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



