Yale开放课程博弈论13

本文探讨了在博弈论中贯序博弈的概念,通过借方与贷方的博弈例子展示了树形图分析方法。逆向归纳法用于预测参与者行为,并讨论了道德风险问题及其解决方案,包括改变合同收益分配、限制项目规模等。此外,还提及了威廉一世的承诺策略和饿狮博弈作为承诺策略的实际应用。

贯序博弈,道德风险、奖励和饥饿的狮子

 

与之前的博弈游戏都不同的是,这节课要讲的借方与贷方的博弈是序博弈(sequential move game)。

 

不同于之前的是,这里是行为有顺序的博弈,关键是在博弈中参与者2在做决定之前可以看到参与者1的决定,而且参与者1知道这种情况。

 

我们对这种博弈的分析方式也不再是画矩阵,而是画树形图。

 

一个关于借方和贷方博弈的小游戏,这里有一顶帽子,参与者1先往帽子里放钱,他的选择可以是不放、放1美元、放3美元,然后将帽子传给参与者2,参与者2看到帽子里的钱之后可以采取的策略为向帽子里放同样多的钱、拿走帽子里的钱。

 

树形图这里就不画了,简单写一下:

若参与者1不放钱到帽子里,则两个人的收益都是0;

若参与者1放1美元,参与者2拿走,则两人的净收益分别为(-1, 1) (player1, player2);

若参与者1放1美元,参与者2也放1美元,则两人的净收益分别为(1, 1.5);

若参与者1放3美元,参与者2拿走,则两人的净收益分别为(-3, 3);

若参与者1放3美元,参与者2也放3美元,则两人的净收益分别为(3, 2);

 

在班上的实验结果是,大家都放了1美元,结果老师需要格外地给他们支付收益,即两个人分别额外地收益了1和1.5美元。为什么会出现这种情况?

 

这里一个很重要的分析方法是逆向归纳法(backwardinduction),即参与者1应该在做决定前对参与者2可能的行为进行预测,即先向树的分支看,再回到树的主干上来。对应这个例子,就是如果参与者放1美元,参与者2的

内容概要:本文是一篇关于使用RandLANet模型对SensatUrban数据集进行点云语义分割的实战教程,系统介绍了从环境搭建、数据准备、模型训练与测试到精度评估的完整流程。文章详细说明了在Ubuntu系统下配置TensorFlow 2.2、CUDA及cuDNN等深度学习环境的方法,并指导用户下载和预处理SensatUrban数据集。随后,逐步讲解RandLANet代码的获取与运行方式,包括训练、测试命令的执行与参数含义,以及如何监控训练过程中的关键指标。最后,教程涵盖测试结果分析、向官方平台提交结果、解读评估报告及可视化效果等内容,并针对常见问题提供解决方案。; 适合人群:具备一定深度学习基础,熟悉Python编程和深度学习框架,从事计算机视觉或三维点云相关研究的学生、研究人员及工程师;适合希望动手实践点云语义分割项目的初学者与进阶者。; 使用场景及目标:①掌握RandLANet网络结构及其在点云语义分割任务中的应用;②学会完整部署一个点云分割项目,包括数据处理、模型训练、测试与性能评估;③为参与相关竞赛或科研项目提供技术支撑。; 阅读建议:建议读者结合提供的代码链接和密码访问完整资料,在本地或云端环境中边操作边学习,重点关注数据格式要求与训练参数设置,遇到问题时参考“常见问题与解决技巧”部分及时排查。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值