53、基础决策理论:模式分类、参数估计与零和博弈

基础决策理论:模式分类、参数估计与零和博弈

1. 决策理论在规划中的应用概述

决策问题常被嵌入复杂的规划问题中,规划可视为在状态空间中迭代修改状态的顺序决策过程。通常,每个决策步骤比决策理论常见应用中的问题更简单,因为规划问题受诸多其他因素影响。若特定应用中的决策步骤已难以解决,那么扩展到规划问题可能就毫无希望。不过,认识在当前框架下建模和解决决策问题时出现的挑战十分重要。

2. 模式分类

模式分类是计算机视觉和机器学习领域过去几十年的活跃领域,涉及使用一组数据进行分类。例如,在计算机视觉中,数据对应从图像中提取的信息,用于视觉系统对物体进行分类。

2.1 一般模型
  • 自然先确定类别,然后获取关于该类别的观测值,最后机器人根据观测值猜测正确类别。
  • 设 $\Theta$ 表示有限的类别集合,由于机器人要猜测类别,所以 $U = \Theta$。定义简单的成本函数来衡量 $u$ 和 $\theta$ 之间的不匹配:
    [
    L(u, \theta) =
    \begin{cases}
    0, & \text{if } u = \theta \text{ (correct classification)} \
    1, & \text{if } u \neq \theta \text{ (incorrect classification)}
    \end{cases}
    ]
  • 非确定性模型中,若使用动作 $u$ 可能导致分类错误,则成本为 1。在概率模型中,上述成本函数的期望给出了给定动作 $u$ 时分类错误的概率。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值