
博弈
文章平均质量分 91
见见大魔王
我很懒
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Reinforcement Mechanism Design:With Applications to Dynamic Pricing in Sponsored Search Auction
才能达到此目的。原创 2022-07-19 16:55:59 · 361 阅读 · 0 评论 -
【博弈】非完全信息博弈基础与CFR算法简介
信息集:玩家无法区分的博弈状态集合,在这些状态下可选择的动作必须遵循同一分布。有限的非完全信息扩展式博弈 在完全信息博弈中,策略是限制在博弈状态中的,它规定了在每个博弈状态下玩家选择合法动作的概率;在非完全信息博弈中,策略与信息集有关,玩家在不同信息集上进行决策。定义:对于玩家 iii 来说,当他处于信息集 IiI_iIi 时,他在动作集合 A(Ii)A(I_i)A(Ii) ...原创 2022-07-12 10:21:11 · 1226 阅读 · 0 评论