CS269I：Incentives in Computer Science 学习笔记：Lecture1 The Draw & College Admissions（抽签与择校）

最新推荐文章于 2025-12-31 21:25:26 发布

翻译最新推荐文章于 2025-12-31 21:25:26 发布 · 331 阅读

1 ·

CC 4.0 BY-SA版权

原文链接：http://timroughgarden.org/f16/f16.html

文章标签：

#算法 #博弈论

学习笔记专栏收录该内容

43 篇文章

订阅专栏

该课程介绍了算法博弈论在实际问题中的应用，如宿舍分配和择校问题。通过抽签分配宿舍的例子，讨论了帕累托最优和防策略性的概念。帕累托最优确保无法在不降低其他人福利的情况下提高某人的福利，而防策略性则意味着参与者诚实时会获得最佳结果。课程还探讨了复杂抽签算法可能导致的策略行为和后悔心理，并预告了涉及学生与学校双向选择的择校问题。

课程地址：http://timroughgarden.org/f16/f16.html

领域：Algorithm Game Theory（算法博弈论）

难度：入门

Introduction

Course Description: Many 21st-century computer science applications require the design of software or systems that interact with multiple self-interested participants. This course will provide students with the vocabulary and modeling tools to reason about such design problems. Emphasis will be on understanding basic economic and game theoretic concepts that are relevant across many application domains, and on case studies that demonstrate how to apply these concepts to real-world design problems. Topics include auction and contest design, equilibrium analysis, cryptocurrencies, design of networks and network protocols, matching markets, reputation systems, and social choice. Possible case studies include BGP routing, Bitcoin, eBay’s reputation system, Facebook’s advertising mechanism, Mechanical Turk, and dynamic pricing in Uber/Lyft.

这门课程的重点在于帮助人们了解该如何将基本的博弈论和经济的理论概念迁移到真实世界中的问题（算法）设计上。

译者注：这门课程是典型的Problem-Oriented，我们将会通过若干个现实的例子来进行算法博弈论的学习

Lecture1 The Draw & College Admissions（抽签与择校）

让我们先来看一个例子：

Example：

斯坦福大学有3500个人，要分配到若干个宿舍去，每个人给出对宿舍的preference（偏好）排序，然后你现在需要设计一个方法来把这些人分配到宿舍里面去。

显然，我们通常使用的方法是Draw（抽签）。

问题：但是，我们为什么要使用抽签呢？如何通过某些概念来“度量”抽签这个算法的合理性？

在接下来的模块中，我们将通过这个问题引入一些概念。

1.1 Pareto Optimality（帕累托最优）

定义：（Pareto Optimality）一个分配结果A称为帕累托最优的，如果无法找到另一个结果B不同于A，使得B中每个人的收益都不低于A（在这个问题中收益即对于分配到的宿舍的喜爱程度）

讨论：这个定义是很合理的，如果我们能在所有人的利益都不变的情况下增加若干人获得的利益，那么为什么不去这么做呢？

定理：抽签得到的结果是帕累托最优的

证明：倘若存在一个结果B，使得B中每个人获得的分配结果都不低于A中的结果，那么由于A是抽签，所以A总有办法得到B的结果，矛盾！（也就是说，抽签得到的结果包含了每一种可能，因此不可能有一种方法能完全强于抽签）

讨论：但是，Pareto最优只是局部极大值。换言之，一个帕累托最优的解除了说明它不能通过非常trivial的方法来改进以外，并不能说明任何问题。例如，在零和博弈（双方的总收益固定的博弈）下，显然不能不损害对方的利益而让自己获益，那么可以说每个结果都是帕累托最优的。所以，帕累托提供的信息是有限的，我们需要更多的描述算法得到的结果的优劣程度的性质。

1.2 Strategy-Proof（防策略）

在进入这个话题之前，我们先来思考一个问题。

问题：是否有的人可能通过“欺骗”算法来获得更好的结果？例如，如果有人要给你三个水果中的一个，问你想要哪一个，你自然有motivation（动机）去说出自己最喜欢的水果是哪一个，因为这对你有好处。但是，如果有人要拿走你的三个水果中的一个，要拿走你最喜欢的一个，你当然更愿意去欺骗他，把自己最不喜欢的水果让他拿走。

定义：（Strategy-Proof）如果机制A能够迫使每一个参与者在保持诚信的时候收益最大，那么称这个机制为防策略的

定理：抽签机制是防策略的

证明：显然，因为抽签得到的结果与每个人提交的偏好无关。

例子：我们还可以举出一些防策略的算法，例如著名的serial dictatorship（序贯独断），即让所有人依次选择尚未被选择的宿舍。显然，每个人都有动机去选自己最喜欢的宿舍，因为选到的就是自己的。