5、博弈论中的标准型与扩展型游戏解析

博弈论中的标准型与扩展型游戏解析

1. 标准型博弈(Normal - Form Games)

标准型博弈是表示玩家互动和策略空间的最基本游戏形式。它通过矩阵(对于两个以上玩家则是多个矩阵)捕捉玩家所有可能的行动或策略组合及其对应的收益。玩家可以选择纯策略(确定性地选择单一策略)或混合策略(指定纯策略上的概率分布),目标是最大化预期效用。

一个有限的 N 人标准型博弈由元组 (, , u) 描述:
-  = {1, …, N} 是 N 个玩家的有限集合,由 i 索引。
-  = 1 × · · · × N 是玩家的联合行动集合,其中 i 是玩家 i 可用的有限行动集合。a = (a1, …, aN) ∈  称为行动配置文件,其中 ai ∈ i。
- u = (u1, …, uN),其中 ui ∶  → ℝ 是玩家 i 的效用(或收益)函数,它将行动配置文件 a 映射到一个实值。玩家 i 的效用不仅取决于自己的行动 ai,还取决于其他玩家的行动。

玩家可以选择混合策略,用 Si = Δ|i| 表示玩家 i 的混合策略集合,它是维度为 |i| 的概率单纯形。S = S1 × · · · × SN 是联合策略集合,s = (s1, …, sN) ∈ S 称为策略配置文件。混合策略的支持集定义为以非零概率选择的行动集合。行动可以表示为支持大小为 1 的概率分布(一维为 1,其他维度为 0)。效用函数可以通过预期效用扩展到混合策略,即 ui(s) = ∑a∈ ui(a) ∏n i′=1 si′(ai′)。如果所有玩家的效用总和始终为零,则游戏是零和游戏;否则是非零和或一般和游戏。

许多经典游戏可以用标准型表示,例如囚

【直流微电网】径向直流微电网的状态空间建模线性化:一种耦合DC-DC变换器状态空间平均模的方法 (Matlab代码实现)内容概要:本文介绍了径向直流微电网的状态空间建模线性化方法,重点提出了一种基于耦合DC-DC变换器状态空间平均模的建模策略。该方法通过对系统中多个相互耦合的DC-DC变换器进行统一建模,构建出整个微电网的集中状态空间模,并在此基础上实施线性化处理,便于后续的小信号分析稳定性研究。文中详细阐述了建模过程中的关键步骤,包括电路拓扑分析、状态变量选取、平均化处理以及雅可比矩阵的推导,最终通过Matlab代码实现模仿真验证,展示了该方法在动态响应分析和控制器设计中的有效性。; 适合群:具备电力电子、自动控制理论基础,熟悉Matlab/Simulink仿真工具,从事微电网、新能源系统建模控制研究的研究生、科研员及工程技术员。; 使用场景及目标:①掌握直流微电网中多变换器系统的统一建模方法;②理解状态空间平均法在非线性电力电子系统中的应用;③实现系统线性化并用于稳定性分析控制器设计;④通过Matlab代码复现和扩展,服务于科研仿真教学实践。; 阅读建议:建议读者结合Matlab代码逐步理解建模流程,重点关注状态变量的选择平均化处理的数学推导,同时可尝试修改系统参数或拓扑结构以加深对模通用性和适应性的理解。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值