- 博客(62)
- 资源 (1)
- 收藏
- 关注
原创 【数学思维】Quasi-convex and quesi-concave
quasi-convex、convex、quasi-concave、concave
2023-01-07 16:51:08
1612
1
原创 【数学思维】运筹学-线性规划之标准形式与Hidden LP
运筹学中,线性规划问题LP的标准形式、标准形式的化简以及Hidden LP如何化为标准形式LP。
2022-09-29 11:57:51
3800
原创 【强化学习】《动手学强化学习》动态规划算法
本文介绍强化学习中的动态规划方法,主要包括策略迭代算法和价值迭代算法。主要内容参考自《动手学强化学习》书籍。
2022-09-17 11:33:21
723
原创 【强化学习】《动手学强化学习》马尔可夫决策过程
本文是参照《动手学强化学习》第三章的学习笔记,主要介绍马尔可夫过程、马尔科夫奖励过程、马尔可夫决策过程与贝尔曼方程。
2022-09-16 15:16:30
613
原创 Competition Among Parallel Contests(博弈论+机制设计) 论文阅读笔记
我们研究一个多个竞赛同时举行的模型,其中每个参赛者选择其中一个竞赛参与以及每个竞赛的设计者决定奖项结构从而竞争以吸引参赛者的参与。首先我们分析了参赛者的策略行为并且完全刻画了对称贝叶斯纳什均衡BNE。对于竞赛设计者的策略,当其他设计者的策略是已知的时候,我们表示计算最优响应是NP-Hard问题并且提出了一个输出1−ϵ1-\epsilon1−ϵ近似最优响应的完全多项式时间的近似算法FPTAS。当其他设计者的策略未知时,我们给出了对于单个设计者策略的最坏情况分析。...
2022-08-29 15:03:14
494
原创 从代码模拟角度理解芝诺悖论
从代码模拟角度理解芝诺悖论一、芝诺悖论简介二、简单代码模拟一、芝诺悖论简介大体讲的是这么个故事:初始状态下,乌龟领先人100米,但乌龟的速度比人要慢,按说只要时间足够、距离足够,人总能追上乌龟;但如果这样考虑,当人走到乌龟的上一阶段位置时,乌龟已经向前了一段距离。这样人一直都会处于追逐状态下但永远都追不上,因为乌龟总会领先一段距离。这样便构成了矛盾,也就是芝诺悖论的基本内容。二、简单代码模拟turtle_x = 100people_x = 0turtle_v = 5people_v = 1
2022-05-19 10:47:22
292
原创 近期几篇有关All-Pay论文总结(博弈论+机制设计)
近期几篇有关All-Pay论文总结1.Nash Convergence of Mean-Based Learning Algorithms in First Price Auctions2.Designing an optimal contest3.Optimal rewards in contests4.Asymmetric All-Pay Auctions with Incomplete Information:The Two-Player Case5.Asymmetric All-Pay Auctio
2022-03-05 15:44:08
1045
原创 Optimal rewards in contests(博弈论+机制设计) 论文阅读笔记
Optimal rewards in contests 论文阅读笔记一、基本信息二、文章摘要三、背景介绍四、本文模型五、核心结论六、总结展望一、基本信息题目:竞赛中的最优奖励作者:Chen Cohen, Todd R.Kaplan, Aner Sela二、文章摘要以下内容取自原文摘要部分:我们在不完全信息的设定下研究带有关乎于分数奖励的全支付竞赛。参赛者获胜的估值不仅仅与他的类型相关,还与设计者选择的独立于分数的奖励相关。我们针对设计者分析当他的目标函数要么是分数总和要么是最高分数时,最优
2022-03-04 14:55:25
663
原创 Designing an optimal contest(博弈论+机制设计) 论文阅读笔记
Designing an optimal contest 论文阅读笔记一、基本信息二、文章摘要三、背景介绍四、核心模型五、核心结论六、总结展望一、基本信息题目:设计一个最优竞赛作者:Ani Dasgupta,Kofi O. Nti二、文章摘要以下内容取自原文摘要部分:本文给竞赛研究带来一个机制设计的角度。我们考虑的问题是:当竞赛设计者也可能对奖项有估值时选择一个竞赛成功函数。我们表明:可以被凹且递增的竞赛成功函数实现的任意均衡结果都可以被线性竞赛成功函数复现。期望效用最大化的设计者应采用线
2022-02-27 16:49:24
606
原创 Nash Convergence of Mean-Based Learning Algorithms in First Price Auctions(博弈论+机制设计) 论文阅读笔记
Nash Convergence of Mean-Based Learning Algorithms in First Price Auctions 论文阅读笔记一、基本信息二、文章摘要三、背景介绍四、本文模型五、核心结论六、总结展望一、基本信息题目:基于均值的学习算法在首价拍卖中的纳什均衡收敛性作者:Xiaotie Deng,Xinyan Hu,Tao Lin,Weiqiang Zheng二、文章摘要以下内容取自原文摘要部分:理解重复拍卖中学习算法的收敛性质是一个对于拍卖学习领域来说迫切
2022-02-26 17:17:41
565
原创 All-Pay Contests 论文定理推导(博弈论+机制设计)
All-Pay Contests 论文定理推导(博弈论+机制设计)一、Theorem 1 证明过程二、Theorem 2 证明过程三、Corollary 1 证明过程四、存在的问题本文针对于全支付竞赛(准确来说是标准竞赛)提出两大结论:Theorem 1有关标准竞赛中参赛者的均衡收益情况;Theorem 2有关标准竞赛中参赛者的均衡参与情况。 Theorem1、2需依赖于均衡存在性定理(原文中Corollary 1)。因此本文证明大体分为三部分。三部分的证明之间存在联系。Corollary 1证明独立
2022-02-23 17:39:19
762
原创 All-Pay Contests 论文问题思考与解答(博弈论+机制设计)
All-Pay Contests 论文问题思考与解答1.啥叫Sunk investment?2.啥叫Rent-Seeking,Lobbying?3.啥叫Irreversible Investments?1.啥叫Sunk investment?直译为沉默投资,更常见的说法是投资中的沉默成本。沉默成本是指过去所付出的时间、金钱等成本,可能对当下决策不会造成任何影响。简单理解为“过去所做的毫无用处的付出”,给人一种鸡肋的感觉,食之无味弃之可惜。本文中指全支付竞赛中,未获胜者也需支付自己的竞价,对参赛者来说是
2022-02-10 17:44:21
652
1
原创 Strategy in contests:an introduction(博弈论+机制设计) 综述论文摘录(持续更新)
本文主要内容包括:竞赛理论常见应用领域、三种类型的竞赛(无噪声的一价全支付竞赛、有噪声的一价全支付竞赛、Tullock竞赛)、决策时序、均衡参与情况、代价函数设计、奖项结构设计、委派决策行为、外部性等内容。
2021-12-24 17:14:19
1471
1
原创 Peer Effects Report(博弈论+机制设计)
Peer Effects Report一、领域概述二、论文总结三、研究可能一、领域概述Peer Effects翻译为同伴效应或者是同群效应,是指社交网络领域中,利用局部的调整作用来达到优化整体目标。首先这是一个社交网络领域的问题,社交网络可能搭载的是经济学行为或者是其他领域行为(如通信),换句话说网络可以有多种作用,不单单局限于经济学问题。研究方法是,对于所研究的具体领域问题进行建模,其中包括:网络结构、效用函数、相互作用机制等等,设计机制利用同伴效应来优化目标,最后通过博弈论的理论分析或者是模拟实验
2021-12-23 16:59:46
999
原创 Optimal Contest Design for Simple Agents(博弈论+机制设计) 论文阅读笔记
本文关注于针对简单代理者的最优竞赛设计,简单代理者是指决策在参与与不参与之间二选一。在两种模型分类下研究,在同质代价函数的设定下得出了最优竞赛的结构,在异质代价函数的设定下得出了近似性质的结果。
2021-12-22 17:28:11
1558
原创 Contest Design with Threshold Objectives(博弈论+机制设计) 论文阅读笔记
Contest Design with Threshold Objectives 论文阅读笔记一、基本信息二、文章摘要三、核心模型一、基本信息题目:作者:Edith Elkind、Abheek Ghosh、Paul W. Goldberg二、文章摘要以下内容取自原文摘要部分:我的总结:三、核心模型...
2021-12-20 17:47:15
621
原创 Optimal Contest Desigh:A General Approach(博弈论+机制设计) 论文阅读笔记
Optimal Contest Desigh:A General Approach 论文阅读笔记一、基本信息二、文章摘要三、核心模型一、基本信息题目:最优竞赛设计:一个通用方法作者:Igor Letina,Shuo Liu,Nick Netzer二、文章摘要以下内容取自原文摘要部分:我们考虑nnn位代理者参加的竞赛设计,其中负责人可以选择奖品组合以及竞赛成功函数。其中我们的框架包括图洛克竞赛(Tullock contests)、Lazear-Rosen锦标赛(Lazear-Rosen to
2021-12-16 17:16:19
422
原创 All-Pay Contests(博弈论+机制设计) 论文阅读笔记
本文聚焦全支付竞赛(拍卖),提出了可分离竞赛、一般化竞赛两大概念。着重研究一般化竞赛的性质,定理1有关一般化竞赛的收益性质,定理2有关一般化竞赛的参与性质。这些性质未来可作为竞赛设计的理论指导。
2021-12-13 17:53:57
2855
原创 Wisdom of the Crowd Voting:Truthful Aggregation of Voter Information and Preference(博弈论+机制设计) 论文阅读笔记
我们考虑两个候选人的选举,其中投票者的偏好取决于一个不可直接观察的状态变量。每个投票者接收到一个与状态变量相关的私人信号。投票者可能是“视情况而定”的,也就是说不同状态下偏好不同,也有可能是“事先注定”的,不同状态下有相同偏好。**在这种设定下,即便每个投票者都是视情况而定的,代理者依据私人信息投票并不一定导致普遍偏好的候选者胜出,这是因为信号可能存在系统偏差**。我们提出一种易于部署的机制去引出并汇聚投票者的私人信号,并且输出被绝大多数投票者偏好的候选者。具体来说,**投票者真实汇报自己的信号从而形成强贝
2021-12-01 15:43:53
595
原创 Optimal Mechanisms with Budget For User Generated Contents(博弈论+机制设计) 论文阅读笔记
Optimal Mechanisms with Budget For User Generated Contents 论文阅读笔记一、基本信息二、文章摘要三、核心模型四、机制算法一、基本信息题目:设计带预算的最优机制激励用户生产高质量内容作者:Mengjing Chen,Pingzhong Tang,Zihe Wang,Shenke Xiao,Xiwang Yang二、文章摘要以下内容取自原文摘要部分:本文中,我们设计总产量最大化机制用以激励用户在UGC网络中上传高质量内容。我们发现,广泛
2021-11-30 16:22:20
399
原创 Peer pressure in extortion game can resolve social dilemma(博弈论+机制设计) 论文阅读笔记
Peer pressure in extortion game can resolve social dilemma 论文阅读笔记一、基本信息二、文章摘要三、核心模型一、基本信息题目:勒索博弈中的同伴压力可以解决社会困境作者:Qing Chang,Yang Zhang二、文章摘要以下内容取自原文摘要部分:勒索策略是零行列式策略的一个重要子集,它保证参与者得到的收益不低于对手的收益,引起了许多学者的关注。同伴压力已经证实在动态演化博弈的自私个体之间维持合作是一个很有效的机制。因此本文中,我们使
2021-11-29 17:38:28
739
1
原创 Peer Pressure and Partnerships(博弈论+机制设计) 论文阅读笔记
Peer Pressure and Partnerships 论文阅读笔记一、基本信息二、文章摘要一、基本信息题目:同伴压力与同伴关系作者:Eugene Kandel、Edward P. Lazear二、文章摘要以下内容取自原文摘要部分:合作被视为我们所期待的社会准则。在这项工作中,建立基于空间公共货物博弈论的框架去研究同伴压力与激励机制是如何影响合作演化的。建立了一个参数可调的统一模型来代表纯个人机制、带有同伴压力的个人机制和社会机制的影响,表明当背叛者感受到的同伴压力和奖励之和大于合作的
2021-11-26 17:59:47
553
原创 Peer pressure and incentive mechanisms in social networks(博弈论+机制设计) 论文阅读笔记
Peer pressure and incentive mechanisms in social networks 论文阅读笔记一、基本信息二、文章摘要一、基本信息题目:社会网络中的同伴压力以及激励机制作者:Chuang Deng、Chao Ye、Lin Wang、Zhihai Rong、Xiaofan Wang二、文章摘要以下内容取自原文摘要部分:...
2021-11-24 17:23:57
343
原创 Peer Pressure(博弈论+机制设计) 论文阅读笔记
Peer Pressure 论文阅读笔记一、基本信息二、文章摘要三、核心模型四、本文总结一、基本信息题目含义:同伴(邻居)压力作者:Antoni Calvó-Armengol、Matthew O. Jackson二、文章摘要以下内容摘自原文摘要部分:我们提出一种模型,在该模型中代理者关心邻居的动作并且可以施压压力来让他们采取既定的动作。施加压力对于施加者来说是代价昂贵的,并且可以通过降低采取动作代价(积极压力)或者提高不采取动作代价(消极压力)的方式来逼迫邻居。我们表明,当行动是策略互补时
2021-11-22 17:38:42
823
原创 Inducing Peer Pressure to Promote Cooperation(博弈论+机制设计) 论文阅读笔记
Inducing Peer Pressure to Promote Cooperation 论文阅读笔记一、文章摘要二、核心模型一、文章摘要题目含义:设计机制引导同伴施压以达到促进合作的目的。以下内容取自原文摘要部分:众所周知当个体决策的外部性在整个社会中传播的时候,在由自利个体组成的大社会中合作是很难达成的。这也就导致了所谓的“公地悲剧”,也就是说理性自利举动最终导致每个人得到更坏的结果。传统促进合作的方法包括:庇古税(庇古提出的环境税)或者发放津贴使得个体带来的外部性内部化。我们提出一种新方法
2021-11-20 19:31:03
576
原创 《斯坦福算法博弈论二十讲》学习笔记(持续更新)
《斯坦福算法博弈论二十讲》学习笔记(持续更新)第一章 简介和实例第二章 机制设计基础第三章 迈尔森引理第四章 算法机制设计第一章 简介和实例羽毛球比赛中的规则漏洞12年伦敦奥运会的羽毛球赛事中发生了一件钻规则漏洞的“丑闻”。赛制规则如下:共分为两个小组,每个小组四只队伍,小组赛阶段各个小组的前两名晋级,A组第1名对阵B组第2名,A组第2名对阵B组第1名,之后进行两两淘汰赛。TZ是本届赛事公认的强队,已经提前小组赛出线。WY与JK进行一场小组赛,二者之间的胜者将会对阵TZ,因此两只队伍都不想赢,都在
2021-11-08 16:37:25
4485
4
原创 进阶博弈论 Advanced Game Theory (Stanford+UBC)学习笔记
进阶博弈论(Advanced Game Theory)学习笔记(持续更新)1-1 Social Choice:Taste1-2 Social Choice:Voting Schemes1-1 Social Choice:Taste投票选举系统非常复杂,并且现有的选举系统并不十分公平合理。我们想通过所学的知识去设想设计一个更优的投票选举系统。1-2 Social Choice:Voting Schemes本章节我们来学习投票机制的基本形式化表达以及几种常见投票机制。投票问题大体指:有一系列候选
2021-10-15 19:53:22
1272
原创 博弈论(Game Theory)入门学习笔记(持续更新)
博弈论(Game Theory)入门学习笔记课程介绍1-1 Taste-Backoff1-2 Self-Interested Agents and Utility Theory1-3 Define1-4 Examples1-5 Nash Equilibrium Intro1-6 Strategic Reasoning课程介绍博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。1-1 Taste-Backoff以一个经典案例引出博弈论
2021-09-21 23:40:41
23174
10
原创 数学建模、运筹学之非线性规划
数学建模、运筹学之非线性规划一、最优化问题理论体系二、梯度下降法——无约束非线性规划三、牛顿法——无约束非线性规划四、只包含等值约束的拉格朗日乘子法五、KKT条件一、最优化问题理论体系最优化问题旨在寻找全局最优值(或为最大值,或为最小值)。最优化问题一般可以分为两个部分:目标函数与约束条件。该问题的进一步细分也是根据这两部分的差异。最优化问题根据变量的取值范围不同可以划分为一般规划与整数规划。一般规划与整数规划都可以对应两种线性与非线性的,只不过非线性规划问题针对一般规划就十分复杂更别说针对整数规划
2021-09-18 15:25:44
2124
原创 数学建模、运筹学之整数规划(原理、例题、代码)
数学建模、运筹学之整数规划(原理、例题、代码)一、何为整数规划?二、整数规划与线性规划三、分枝定界法一、何为整数规划?整数规划具有深远的实际应用价值,因为现实生活中的规划、最优化问题大部分不是实数范围的规划而是整数规划,比如工人的数量、所需多台机器的数量等等。而整数规划并不像看起来那么简单,单纯将线性规划最优解取整得到的甚至都不一定是可行解。因此整数规划需要区分于线性规划独立设计算法解决,目前仍未针对整数规划发现多项式级别的算法。不加特别说明的情况下,我们所说的整数规划实际上是整数线性规划。本文仍旧
2021-09-14 11:19:19
6849
2
原创 目标检测之Mask R-CNN(Pytorch):小白动手实现项目
目标检测之Mask R-CNN:小白动手实现项目Pytorch引言Mask R-CNN原理简述代码、注释及详细解释引言首先声明本项目的运行环境。操作系统为Windows,编写环境为Anaconda3 + Jupyter Notebook。Pytorch版本为 torch 1.7.1+cu110 、torchvision版本为 0.8.2+cu110,cuda版本为cu100,显卡为Nvidia 2060。我是目标检测领域的小白,刚刚完成了Pytorch的相关入门学习任务,所以我认为学习本篇博客的基础
2021-08-27 18:03:59
19055
20
原创 Error:all tensors must be on devices[0] 初学者解决方案
Error:all tensors must be on devices[0] 初学者解决方案一、问题简介二、解决方法三、完整代码一、问题简介作为Pytorch初学者,我跟随教程实现图像分类数据集 FashionMinist 的 softmax 多分类项目。过程中最后一步调用d2lzh_pytorch包中的train_ch3函数,产生如下报错提示。RuntimeError: Expected all tensors to be on the same device, but found at lea
2021-08-04 18:11:21
1176
1
原创 机器学习笔记——集成学习EnsembleLearning+代码详解
机器学习笔记——集成学习“三巨头”EnsembleLearning一、集成学习初步了解1.1 集成学习基本思想1.2 集成学习分类二、AdaBoost2.1 AdaBoost基本思想2.2 AdaBoost算法三、GBM/GBDT四、RandomForest一、集成学习初步了解1.1 集成学习基本思想集成学习(Ensemble Learning)通过构建并结合多个学习器来完成学习任务,有时也可以被称为多分类器系统或者是基于委员会的学习等等。集成学习基本由两部分组成,选择个体学习器种类并生成一定量的
2020-12-17 14:30:08
2228
4
原创 CCF准备日记——202009-3(邻接矩阵+拓扑排序)
CCF准备日记——202009-3题目编号:202009-3题目名称:点亮数字人生使用语言:Java(Eclipese)题目描述:我的代码:import java.util.*;public class Main11 { //静态内部类Meta用来表示电子器件 public static class Meta{ public String type;//每个器件的功能类型 public List<Integer> inputs;
2020-12-11 11:05:05
298
计算机体系结构——局部性原理研究分享
2020-11-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人