1、如果R是我们的奖励集合,我们的效用函数是U : R →R,并且当且仅当U(a) > U(b)时a ≻∗b,那么我们的偏好是可传递的。请给出一个不一定映射到R的效用函数和一个二元关系>的例子,使得传递性可能被违反,并通过一个思想实验来支持你的例子。
向量奖励与偏好关系分析
考虑向量奖励 $ R = R^2 $,其中 $ r_i = (a_i, b_i) $,且有 $ \epsilon, \epsilon’ > 0 $。
偏好关系定义
- 若 $ b_i \geq b_j + \epsilon’ $,则 $ r_i \succ^* r_j $;
- 若 $ a_i \geq a_j $ 且 $ |b_i - b_j| < \epsilon $,则 $ r_i \succ^* r_j $。
思想实验
例如,雇主根据以下两个因素决定雇佣两名员工 $ i $ 和 $ j $:
- 经验 $ a $
- 学校成绩 $ b $
由于成绩不太可靠,若两人成绩相近,会优先选择经验更丰富的。
候选人序列假设
假设有一系列候选人 $ i = 1, \dots, n $,满足:
- $ b_i = b_{i+1} + \delta $,其中 $ \delta < \epsilon $
- $ a_i > a_{i+1} $
显然,总是会优先选择 $ r_i $ 而非 $ r_{i+1} $。
但如果 $ \delta n > \epsilon $,就会出现优先选择 $ r_n $ 而非 $ r_1 $ 的情况,这违反了传递性。
2、考虑两个罐子,每个罐子里都有红色和蓝色的球。第一个罐子里红球和蓝球数量相等。第二个罐子里红球的比例是随机选取的X,即从第二个罐子中取出红球的概率是X。1. 假设你要选择一个罐子,然后从该罐子中随机取出一个球。如果取出的球是红色,你赢得1个货币单位(CU),否则什么也得不到。证明:如果你的效用函数随货币收益增加而增加,当且仅当E(X) < 1/2时,你应该选择第一个罐子。2. 假设你要选择一个罐子,然后仅从该罐子中随机取出n个球。每次取出红球,你获得1个货币单位。取出球后,你将球放回罐子。假设效用函数U是严格凹函数,并且E(X) = 1/2。证明你应该总是从第一个罐子中取球。
- 对于第一个问题,从第一个罐子中取出红球的概率为 $ \frac{1}{2} $,获得 1 个货币单位的效用为 $ U(1) $,期望效用为:
$$
E_1 = \frac{1}{2} \cdot U(1)
$$
从第二个罐子中取出红球的概率为 $ X $,期望效用为:
$$
E_2 = E(X) \cdot U(1)
$$
因为效用函数随货币收益增加而增加,即 $ U(1) > 0 $,当 $ E_1 > E_2 $ 时,也就是:
$$
\frac{1}{2} \cdot U(1) > E(X) \cdot U(1)
$$
两边同时除以 $ U(1) $,可得:
$$
E(X) < \frac{1}{2}
$$
此时应选择第一个罐子。
- 对于第二个问题,对于第二个罐子,$ E(U | x) $ 在 $ 0 \leq x \leq 1 $ 时是凹函数(可通过证明 $ \frac{d^2}{dx^2} E(U | x) < 0 $ 得出):
$$
\frac{d^2}{dx^2} E(U | x) = n(n - 1) \sum \left[ U(k) - 2U(k + 1) + U(k + 2) \right] C(n - 2, k) x^k (1 - x)^{n - 2 - k}
$$
然后应用詹森不等式。由于效用 $ U $ 严格凹且 $ E(

最低0.47元/天 解锁文章
907

被折叠的 条评论
为什么被折叠?



