49、决策问题与Julia编程基础

决策问题与Julia编程基础

1. 决策问题分析

1.1 哭闹宝宝问题

在照顾宝宝的场景中,有喂食、唱歌和忽略三种行为,不同行为对宝宝状态(饥饿或饱腹)的转变和宝宝哭闹的观察有不同影响。
- 状态转变动态
- 喂食总是能让饥饿的宝宝饱腹,即 (T(sated | hungry, feed) = 100\%);
- 唱歌和忽略时,饥饿的宝宝仍保持饥饿,即 (T(hungry | hungry, sing) = 100\%),(T(hungry | hungry, ignore) = 100\%);
- 饱腹时,唱歌和忽略有 (10\%) 的概率让宝宝变饥饿,即 (T(hungry | sated, sing) = 10\%),(T(hungry | sated, ignore) = 10\%)。
- 观察动态
- 宝宝饥饿时,喂食、唱歌和忽略对应的哭闹概率分别为 (O(cry | feed, hungry) = 80\%),(O(cry | sing, hungry) = 90\%),(O(cry | ignore, hungry) = 80\%);
- 宝宝饱腹时,喂食和忽略对应的哭闹概率为 (10\%),唱歌时哭闹概率为 (0\%),即 (O(cry | feed, sated) = 10\%),(O(cry | sing, sated) = 0\%),(O(cry | ignore, sated) = 10\%)。
- 奖励函数 :宝宝饥饿时给予 (-10) 的奖励,喂食额外增加 (-5) 的

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值