基础决策理论:模式分类、参数估计与零和博弈
1. 决策理论应用概述
决策理论在众多领域有着广泛的应用,在解决实际问题时,决策过程常被嵌入到复杂的规划问题中。规划可看作是在状态空间中迭代修改状态的顺序决策过程,通常每个决策步骤比决策理论常见应用中的问题要简单,因为规划问题受诸多其他因素影响。下面将介绍决策理论的两个重要应用:模式分类和参数估计。
2. 模式分类
2.1 模式分类问题概述
模式分类是计算机视觉和机器学习领域过去几十年的活跃研究方向。其一般问题是利用一组数据进行分类,例如在计算机视觉中,数据对应从图像中提取的信息,用于视觉系统对物体进行分类。不过,实际应用中获取合适的数据往往成本高或难以实现,有些问题甚至是无监督的,需要自动发现可能的类别,因此模式分类仍是具有挑战性的研究领域。
2.2 模式分类的一般模型
模式分类的一般模型是:自然先确定类别,然后获取关于该类别的观测值,最后机器人根据观测值猜测正确的类别。设 $\Theta$ 表示有限的类别集合,由于机器人要猜测类别,所以动作集合 $U = \Theta$。定义一个简单的成本函数来衡量猜测类别 $u$ 和实际类别 $\theta$ 之间的不匹配程度:
[
L(u, \theta) =
\begin{cases}
0, & \text{如果 } u = \theta \text{ (正确分类)}\
1, & \text{如果 } u \neq \theta \text{ (错误分类)}
\end{cases}
]
在非确定性模型中,如果使用动作 $u$ 可
超级会员免费看
订阅专栏 解锁全文
13

被折叠的 条评论
为什么被折叠?



