基础决策理论:模式分类、参数估计与零和博弈
1. 决策理论在规划中的应用概述
决策问题常被嵌入复杂的规划问题中,规划可视为在状态空间中迭代修改状态的顺序决策过程。通常,每个决策步骤比决策理论常见应用中的问题更简单,因为规划问题受诸多其他因素影响。若特定应用中的决策步骤已难以解决,那么扩展到规划问题可能就毫无希望。不过,认识在当前框架下建模和解决决策问题时出现的挑战十分重要。
2. 模式分类
模式分类是计算机视觉和机器学习领域过去几十年的活跃领域,涉及使用一组数据进行分类。例如,在计算机视觉中,数据对应从图像中提取的信息,用于视觉系统对物体进行分类。
2.1 一般模型
- 自然先确定类别,然后获取关于该类别的观测值,最后机器人根据观测值猜测正确类别。
- 设 $\Theta$ 表示有限的类别集合,由于机器人要猜测类别,所以 $U = \Theta$。定义简单的成本函数来衡量 $u$ 和 $\theta$ 之间的不匹配:
[
L(u, \theta) =
\begin{cases}
0, & \text{if } u = \theta \text{ (correct classification)} \
1, & \text{if } u \neq \theta \text{ (incorrect classification)}
\end{cases}
] - 非确定性模型中,若使用动作 $u$ 可能导致分类错误,则成本为 1。在概率模型中,上述成本函数的期望给出了给定动作 $u$ 时分类错误的概率。
超级会员免费看
订阅专栏 解锁全文
15

被折叠的 条评论
为什么被折叠?



