向量奖励与偏好关系分析

1、如果R是我们的奖励集合,我们的效用函数是U : R →R,并且当且仅当U(a) > U(b)时a ≻∗b,那么我们的偏好是可传递的。请给出一个不一定映射到R的效用函数和一个二元关系>的例子,使得传递性可能被违反,并通过一个思想实验来支持你的例子。

向量奖励与偏好关系分析

考虑向量奖励 $ R = R^2 $,其中 $ r_i = (a_i, b_i) $,且有 $ \epsilon, \epsilon’ > 0 $。

偏好关系定义

  1. 若 $ b_i \geq b_j + \epsilon’ $,则 $ r_i \succ^* r_j $;
  2. 若 $ a_i \geq a_j $ 且 $ |b_i - b_j| < \epsilon $,则 $ r_i \succ^* r_j $。

思想实验

例如,雇主根据以下两个因素决定雇佣两名员工 $ i $ 和 $ j $:

  • 经验 $ a $
  • 学校成绩 $ b $

由于成绩不太可靠,若两人成绩相近,会优先选择经验更丰富的。

候选人序列假设

假设有一系列候选人 $ i = 1, \dots, n $,满足:

  • $ b_i = b_{i+1} + \delta $,其中 $ \delta < \epsilon $
  • $ a_i > a_{i+1} $

显然,总是会优先选择 $ r_i $ 而非 $ r_{i+1} $。

但如果 $ \delta n > \epsilon $,就会出现优先选择 $ r_n $ 而非 $ r_1 $ 的情况,这违反了传递性。

2、考虑两个罐子,每个罐子里都有红色和蓝色的球。第一个罐子里红球和蓝球数量相等。第二个罐子里红球的比例是随机选取的X,即从第二个罐子中取出红球的概率是X。1. 假设你要选择一个罐子,然后从该罐子中随机取出一个球。如果取出的球是红色,你赢得1个货币单位(CU),否则什么也得不到。证明:如果你的效用函数随货币收益增加而增加,当且仅当E(X) < 1/2时,你应该选择第一个罐子。2. 假设你要选择一个罐子,然后仅从该罐子中随机取出n个球。每次取出红球,你获得1个货币单位。取出球后,你将球放回罐子。假设效用函数U是严格凹函数,并且E(X) = 1/2。证明你应该总是从第一个罐子中取球。

  1. 对于第一个问题,从第一个罐子中取出红球的概率为 $ \frac{1}{2} $,获得 1 个货币单位的效用为 $ U(1) $,期望效用为:

$$
E_1 = \frac{1}{2} \cdot U(1)
$$

从第二个罐子中取出红球的概率为 $ X $,期望效用为:

$$
E_2 = E(X) \cdot U(1)
$$

因为效用函数随货币收益增加而增加,即 $ U(1) > 0 $,当 $ E_1 > E_2 $ 时,也就是:

$$
\frac{1}{2} \cdot U(1) > E(X) \cdot U(1)
$$

两边同时除以 $ U(1) $,可得:

$$
E(X) < \frac{1}{2}
$$

此时应选择第一个罐子。

  1. 对于第二个问题,对于第二个罐子,$ E(U | x) $ 在 $ 0 \leq x \leq 1 $ 时是凹函数(可通过证明 $ \frac{d^2}{dx^2} E(U | x) < 0 $ 得出):

$$
\frac{d^2}{dx^2} E(U | x) = n(n - 1) \sum \left[ U(k) - 2U(k + 1) + U(k + 2) \right] C(n - 2, k) x^k (1 - x)^{n - 2 - k}
$$

然后应用詹森不等式。由于效用 $ U $ 严格凹且 $ E(

跟网型逆变器小干扰稳分析控制策略优化研究(Simulink仿真实现)内容概要:本文围绕跟网型逆变器的小干扰稳性展开分析,重点研究其在电力系统中的动态响应特性及控制策略优化问题。通过构建基于Simulink的仿真模型,对逆变器在不同工况下的小信号稳性进行建模分析,识别系统可能存在的振荡风险,并提出相应的控制优化方法以提升系统稳性和动态性能。研究内容涵盖数学建模、稳性判据分析、控制器设计参数优化,并结合仿真验证所提策略的有效性,为新能源并网系统的稳运行提供理论支持和技术参考。; 适合人群:具备电力电子、自动控制或电力系统相关背景,熟悉Matlab/Simulink仿真工具,从事新能源并网、微电网或电力系统稳性研究的研究生、科研人员及工程技术人员。; 使用场景及目标:① 分析跟网型逆变器在弱电网条件下的小干扰稳性问题;② 设计并优化逆变器外环内环控制器以提升系统阻尼特性;③ 利用Simulink搭建仿真模型验证理论分析控制策略的有效性;④ 支持科研论文撰写、课题研究或工程项目中的稳性评估改进。; 阅读建议:建议读者结合文中提供的Simulink仿真模型,深入理解状态空间建模、特征值分析及控制器设计过程,重点关注控制参数变化对系统极点分布的影响,并通过动手仿真加深对小干扰稳性机理的认识。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值