CS269I:Incentives in Computer Science 学习笔记 :Lecture1 The Draw & College Admissions(抽签与择校)

该课程介绍了算法博弈论在实际问题中的应用,如宿舍分配和择校问题。通过抽签分配宿舍的例子,讨论了帕累托最优和防策略性的概念。帕累托最优确保无法在不降低其他人福利的情况下提高某人的福利,而防策略性则意味着参与者诚实时会获得最佳结果。课程还探讨了复杂抽签算法可能导致的策略行为和后悔心理,并预告了涉及学生与学校双向选择的择校问题。

课程地址:http://timroughgarden.org/f16/f16.html

领域:Algorithm Game Theory(算法博弈论)

难度:入门

Introduction

Course Description: Many 21st-century computer science applications require the design of software or systems that interact with multiple self-interested participants. This course will provide students with the vocabulary and modeling tools to reason about such design problems. Emphasis will be on understanding basic economic and game theoretic concepts that are relevant across many application domains, and on case studies that demonstrate how to apply these concepts to real-world design problems. Topics include auction and contest design, equilibrium analysis, cryptocurrencies, design of networks and network protocols, matching markets, reputation systems, and social choice. Possible case studies include BGP routing, Bitcoin, eBay’s reputation system, Facebook’s advertising mechanism, Mechanical Turk, and dynamic pricing in Uber/Lyft.

这门课程的重点在于帮助人们了解该如何将基本的博弈论和经济的理论概念迁移到真实世界中的问题(算法)设计上。

译者注:这门课程是典型的Problem-Oriented,我们将会通过若干个现实的例子来进行算法博弈论的学习

Lecture1 The Draw & College Admissions(抽签与择校)

让我们先来看一个例子:

Example:

​ 斯坦福大学有3500个人,要分配到若干个宿舍去,每个人给出对宿舍的preference(偏好)排序,然后你现在需要设计一个方法来把这些人分配到宿舍里面去。

显然,我们通常使用的方法是Draw(抽签)。

问题:但是,我们为什么要使用抽签呢?如何通过某些概念来“度量”抽签这个算法的合理性?

在接下来的模块中,我们将通过这个问题引入一些概念。

1.1 Pareto Optimality(帕累托最优)

定义:(Pareto Optimality)一个分配结果A称为帕累托最优的,如果无法找到另一个结果B不同于A,使得B中每个人的收益都不低于A(在这个问题中收益即对于分配到的宿舍的喜爱程度)

讨论:这个定义是很合理的,如果我们能在所有人的利益都不变的情况下增加若干人获得的利益,那么为什么不去这么做呢?

定理抽签得到的结果是帕累托最优的

证明:倘若存在一个结果B,使得B中每个人获得的分配结果都不低于A中的结果,那么由于A是抽签,所以A总有办法得到B的结果,矛盾!(也就是说,抽签得到的结果包含了每一种可能,因此不可能有一种方法能完全强于抽签

讨论:但是,Pareto最优只是局部极大值。换言之,一个帕累托最优的解除了说明它不能通过非常trivial的方法来改进以外,并不能说明任何问题。例如,在零和博弈(双方的总收益固定的博弈)下,显然不能不损害对方的利益而让自己获益,那么可以说每个结果都是帕累托最优的。所以,帕累托提供的信息是有限的,我们需要更多的描述算法得到的结果的优劣程度的性质。

1.2 Strategy-Proof(防策略)

在进入这个话题之前,我们先来思考一个问题。

问题:是否有的人可能通过“欺骗”算法来获得更好的结果?例如,如果有人要给你三个水果中的一个,问你想要哪一个,你自然有motivation(动机)去说出自己最喜欢的水果是哪一个,因为这对你有好处。但是,如果有人要拿走你的三个水果中的一个,要拿走你最喜欢的一个,你当然更愿意去欺骗他,把自己最不喜欢的水果让他拿走。

定义:(Strategy-Proof)如果机制A能够迫使每一个参与者在保持诚信的时候收益最大,那么称这个机制为防策略的

定理抽签机制是防策略的

证明:显然,因为抽签得到的结果与每个人提交的偏好无关。

例子:我们还可以举出一些防策略的算法,例如著名的serial dictatorship(序贯独断),即让所有人依次选择尚未被选择的宿舍。显然,每个人都有动机去选自己最喜欢的宿舍,因为选到的就是自己的。

2 The Draw in the 1990s(抽签的历史)

例子:在20世纪90年代中期,斯坦福大学的抽签方式实际上更加复杂。它采取以下的算法:

​ 每个人按顺序报出自己最喜欢的前八个宿舍并进行排序,然后电脑抽签决定“序贯独断”的顺序,决定顺序后,按照顺序选择宿舍,选择规则是:优先给出其提出的8个宿舍中最好的一个,但是如果8个全都满员了,那么就把他安排到学校最差的宿舍里去。

讨论:我们来用一些其他的概念观察一下这个算法的特征:

  1. 显然,这个方法让同学们多了很多的思考量。虽然它的本意是让同学们在选择宿舍时不要过于贪婪,但是这样同样增加了同学们给出自己的选择的难度

  2. 人们在看到抽签的结果的时候,可能会“regret”(后悔),如果早知道抽签的结果是这样,8个宿舍的选择就会XXX,但是为时已晚

3 College Admission(择校)

讨论:上面列举的分配宿舍的问题是一个单边的问题,也就是说,只有学生选择宿舍,而宿舍并不会选择学生。但是,一个更加复杂的问题是择校。在择校的过程中,学生会选择学校,学校也会选择学生。双方都有一个偏好排序,那么我们应该如何满足他们的需求呢?请看下集。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值