简单决策中的效用理论与人类行为分析
1. 彩票的期望效用
彩票的效用是每个结果的概率乘以该结果的效用之和,用公式表示为:
$U([p_1,S_1;…; p_n,S_n]) = \sum_{i} p_iU(S_i)$
一旦确定了可能结果状态的概率和效用,涉及这些状态的复合彩票的效用就完全确定了。一个理性的智能体只有通过选择能根据上述公式最大化期望效用的行动,才能做出符合其偏好的理性行为。
需要注意的是,效用函数并非唯一的。如果一个智能体的效用函数$U(S)$按照$U’(S) = aU(S)+b$(其中$a$和$b$为常数且$a > 0$,这是一种正仿射变换)进行变换,其行为不会改变。在确定性环境中,智能体只需要对状态进行偏好排序,这被称为价值函数或序数效用函数。
2. 效用函数的基本概念
效用函数将彩票映射到实数,它必须遵循可排序性、传递性、连续性、可替代性、单调性和可分解性等公理。严格来说,一个智能体可以有任何它喜欢的偏好。例如,一个智能体可能更喜欢银行账户中有质数金额的美元;或者更喜欢一辆有凹痕的1973年福特平托汽车,而不是一辆崭新的奔驰汽车。不过,现实中智能体的偏好通常更具系统性,便于处理。
3. 效用评估与效用尺度
如果要构建一个帮助人类做决策或代表人类行动的决策理论系统,首先需要确定人类的效用函数,这个过程通常称为偏好引出。具体做法是向人类呈现选择,并根据观察到的偏好来确定潜在的效用函数。
由于不存在绝对的效用尺度,通常通过固定任意两个特定结果的效用值来建立一个尺度,就像通过固定水的冰点和沸点来确定温度尺度一样。一般将“最佳可能奖品”的效用固定为$U(S) = u_{\to
效用理论与人类非理性决策
超级会员免费看
订阅专栏 解锁全文

1756

被折叠的 条评论
为什么被折叠?



