智能停车推理与共享内存多核机器上的推测性 PDES 平台优化
1. 智能停车推理
1.1 成本与效用计算
在智能停车场景中,成本值 (c_i) 的计算与代理 (a_i) 到达停车位 (s_i) 的情况相关。若代理 (a_i) 有足够时间到达停车位 (s_i),且该车位未被恢复能力更低((f_k < f_i))的其他代理 (a_k) 占用,成本值 (c_i) 为有限值,此有限值反映了代理到达指定车位后剩余时间与总可用时间的相对关系。若成本值被设为最高值 (B),则表示代理 (a_i) 无法在 (s_i) 车位停车,这是最坏的结果。
代理 (i) 对于策略组合 (\overline{s}) 的效用 (u_i(\overline{s})) 计算公式为:(u_i(\overline{s}) = B - \overline{c}_i(\overline{s})),即 (u_i(\overline{s})) 是最高成本 (B) 与给定策略 (\overline{s}) 下实际成本 (c_i) 的差值。而系统的社会福利则是所有代理效用之和。
1.2 纳什均衡
策略组合 (s) 若满足对于所有玩家 (i) 和每个替代策略 (s’ i),都有 (u_i(s_i, s {-i}) \geq u_i(s’ i, s {-i})),则该策略组合为纳什均衡。这意味着在其他玩家坚持所选策略的情况下,玩家 (i) 无法通过将所选策略从 (s_i) 改变为 (s’ i) 来提高自身效用。一旦玩家处于这种均衡状态,坚持自身策略符合每个玩家的最佳利益。策略 (\overline{s}) 的总成本 (\pi)
超级会员免费看
订阅专栏 解锁全文
64

被折叠的 条评论
为什么被折叠?



