53、基础决策理论:模式分类、参数估计与零和博弈

基础决策理论:模式分类、参数估计与零和博弈

1. 决策理论应用概述

决策理论在众多领域有着广泛的应用,在解决实际问题时,决策过程常被嵌入到复杂的规划问题中。规划可看作是在状态空间中迭代修改状态的顺序决策过程,通常每个决策步骤比决策理论常见应用中的问题要简单,因为规划问题受诸多其他因素影响。下面将介绍决策理论的两个重要应用:模式分类和参数估计。

2. 模式分类

2.1 模式分类问题概述

模式分类是计算机视觉和机器学习领域过去几十年的活跃研究方向。其一般问题是利用一组数据进行分类,例如在计算机视觉中,数据对应从图像中提取的信息,用于视觉系统对物体进行分类。不过,实际应用中获取合适的数据往往成本高或难以实现,有些问题甚至是无监督的,需要自动发现可能的类别,因此模式分类仍是具有挑战性的研究领域。

2.2 模式分类的一般模型

模式分类的一般模型是:自然先确定类别,然后获取关于该类别的观测值,最后机器人根据观测值猜测正确的类别。设 $\Theta$ 表示有限的类别集合,由于机器人要猜测类别,所以动作集合 $U = \Theta$。定义一个简单的成本函数来衡量猜测类别 $u$ 和实际类别 $\theta$ 之间的不匹配程度:
[
L(u, \theta) =
\begin{cases}
0, & \text{如果 } u = \theta \text{ (正确分类)}\
1, & \text{如果 } u \neq \theta \text{ (错误分类)}
\end{cases}
]
在非确定性模型中,如果使用动作 $u$ 可

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值