人工智能原理第五章课后习题(仅供参考)

本文详细阐述了博弈论的基本概念,包括合作与非合作、零和与非零和、完美与非完美信息等六种博弈类型。接着讨论了博弈算法的历史意义,以及经典搜索、局部搜索和对抗搜索的异同。重点介绍了最小最大策略及其在非零和博弈中的应用,以及蒙特卡洛方法在解决复杂问题上的作用。此外,还对比了完美信息与不完美信息博弈的难度,并探讨了遗憾最小化和虚拟遗憾最小化算法在同步与顺序博弈中的应用。最后,分析了对称与非对称博弈的特性,并简要介绍了重复博弈与随机博弈的区别。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

5.1 回顾博弈问题的六种类型,是否还有其它类型的博弈?为什么?
1. 合作与非合作:
合作博弈是指参与者从己方的利益出发与其他参与达成协议或者形成联盟,其结果对各方均有利;
非合作博弈则与其相反,参与者无法形成约束性协议或联盟,因而选择对抗性的行为。(囚徒困境)
2. 零和与非零和
零和博弈指的是参与者各方经过博弈之后,一方的收益必然意味着另一方的损失,或者双方的结果是平局。因此零和博弈中各方的收益和损失之和永远为零。
非零和博弈则指的是博弈后各方的收益小于或大于零,即非零。(囚徒困境,带有合作竞争的关系)
3. 完美与不完美信息
完美信息博弈,指的是在顺序博弈的过程中,每个参与者在做任何决策时都完全了解曾将发生的所有信息,否则称为非完美博弈。(完美:象棋,西洋跳棋等)
4. 对称与非对称
对称博弈指的是每个参与者在博弈中采取与对手相同的策略时能得到同样的收益,即改变参与者的身份而不会改变策略的收益,则该博弈是对称的。
5. 随机与非随机
随机博弈由一个或多个参与者参与的具有概率变迁性质的动态游戏。随机博弈比赛一般分阶段进行。每一阶段开始时,游戏处于某种随机状态。某个博弈者选择动作,其他博弈者们接受一个取决于当前状态和所选动作的回报。然后游戏进入一个新的随机状态&#x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值