在线声誉机制中激励兼容与均衡策略分析
在在线市场中,获取真实的反馈对于声誉机制的成功至关重要。为了确保自利的参与者如实报告其观察结果,人们设计了各种激励兼容的声誉机制。下面将介绍两种这样的机制:MRZ机制和JF机制,并分析它们的均衡策略以及可信报告对这些策略的影响。
1. 反馈支付规则
反馈的支付依据一个考虑当前信念、报告价值以及其他客户(评级者)未来报告价值的支付规则。当支付由适当的评分规则定义时,每个代理在评级者诚实报告的情况下都有动机提交真实反馈,从而使机制具有激励兼容的纳什均衡(NEQ)。
一种可能的支付规则是:
[R(p(\cdot), r, r_r) = \log(\Pr[r_r|r, p(\cdot)]) = \log\left(\sum_{t\in T} p(t|r) \cdot f(r_r|t)\right)]
其中,$p(\cdot)$ 是代理的先验信念,$r \in S$ 是代理的报告,$r_r \in S$ 是指定评级者的未来报告,$\Pr[r_r|r]$ 是在当前报告者观察到 $r$ 的情况下,评级者观察到信号 $r_r$ 的后验概率。通常用 $R(s_i, s_j)$ 表示代理报告 $s_i$ 且评级者报告 $s_j$ 时代理获得的支付。
2. JF激励兼容声誉机制
JF机制适用于客户观察到的二进制信号不仅受服务类型影响,还受时间影响的情况。观察信号的概率分布用可变长度的马尔可夫链建模。
报告的附带支付遵循一个非常简单的规则,不依赖于代理或声誉机制的信念。只有当另一个客户关于同一服务提交的下一份报告具有相同值时,报告才会获得支付。支付金额会动态调整,以使机制实现预算平衡
超级会员免费看
订阅专栏 解锁全文
642

被折叠的 条评论
为什么被折叠?



