Twenty Lectures on Algorithmic Game Theory 算法博弈论二十讲 Lecture 5 Revenue-Maximizing Auctions (上)

Twenty Lectures on Algorithmic Game Theory 算法博弈论二十讲 Lecture 5 Revenue-Maximizing Auctions (上)

Lecture 5 Revenue-Maximizing Auctions

第 2 至第 4 讲聚焦于设计能够最大化社会福利的机制,无论是精确还是近似。这类机制的收益产生仅仅是副作用,是激励代理人如实报告私人信息的必要之恶。本讲研究旨在最大化收益的机制,并对基于代理人估值先验分布的期望收益最大化机制进行特征描述。

第 5.1 节解释了为何收益最大化的推理比福利最大化更为困难,并介绍了贝叶斯环境。第 5.2 节是本讲的核心,它将期望收益最大化机制描述为“虚拟福利最大化者”。第 5.3 节描述了这一理论如何被用于提升 Yahoo 的赞助搜索收益。第 5.4 节证明了第 5.2 节所需的技术引理。

5.1 The Challenge of Revenue Maximization

5.1.1 Spoiled by Social Welfare Maximization

有几个理由解释为什么在机制设计的研究中,首先以最大化社会福利为目标。第一个理由是这一目标与许多现实场景相关。例如,在政府拍卖(例如,出售无线频谱;见第 8 讲)中,主要目标是福利最大化。虽然收益也是这些拍卖中的一个考虑因素,但通常不是首要目标。此外,在竞争市场中,一般的规则是卖方应该关注福利最大化,否则竞争对手会(从而抢走他们的客户)。

第二个理由是教学上的:社会福利具有特殊性。在每一个单参数环境中,都存在一个 DSIC 机制,该机制在每个私人估值配置下,假设真实出价,计算出福利最大化的结果(参见练习 4.1)。这样的机制在优化社会福利方面表现得像是所有私人信息事先已知一样——DSIC 约束条件得到了免费满足。

这种被称为“事后”保证的惊人强性能保障,一般无法在其他目标函数上实现。

5.1.2 One Bidder and One Item

以下这个简单的例子能够很好地阐明问题。假设有一个物品,且只有一个竞标者,拥有一个私人估值 v。在只有一个竞标者的情况下,直接揭示的 DSIC 拍卖空间很小:它们恰好是固定价格拍卖,即“要么接受要么放弃”的报价。设定一个固定价格 $ ,拍卖的收益要么是 r (如果 ,拍卖的收益要么是r(如果 ,拍卖的收益要么是r(如果v \geq r ),要么是 0 (如果 ),要么是0(如果 ),要么是0(如果v < r )。 )。 )。r \geq 0$

在这种情况下,最大化社会福利是显而易见的:只需将 r 设为 0,这样拍卖总能将物品免费授予竞标者。这一最优的固定价格与 v 无关。

假设我们想要最大化收益。我们应该如何设置 r 呢?如果我们能心灵感应地知道 v,我们会将 r 设为 v。但当 v 对竞标者而言是私密的,我们该怎么做呢?关于这个问题,推理并不那么明确。

根本问题在于,收益最大化的拍卖会随着私人估值的变化而变化。对于单个物品和竞标者,当 v 为 20 或稍大时,设定一个 20 的固定价格效果会很好;而当 v 小于 20 时,效果则会很糟糕(而较低的固定价格则会表现得更好)。相比之下,福利最大化问题中存在一个与输入无关的最优 DSIC 机制,这确实是特别之处。

5.1.3 Bayesian Analysis

要比较两个不同拍卖的收益,我们需要一个模型来比较不同输入间的权衡。经典的方法是使用平均情况或贝叶斯分析。我们考虑一个包含以下要素的模型:

一个单参数环境(见第 3.1 节)。我们假设存在一个常数 M,使得对于每个参与者 i 和每个可行解 ( x 1 , … , x n ) ∈ X (x_1, \dots, x_n) \in X (x1,,xn)</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值