- 博客(14)
- 资源 (2)
- 收藏
- 关注
原创 简述Fictitious Play原理及实现
例如,对手的策略可能依赖于虚拟玩家的上一次动作。的加权平均值,其中上一轮策略占据的权重逐渐减小,最佳响应动作占据的权重逐渐增加。这种加权平均的方式使得玩家的策略在每一轮中逐渐逼近最佳响应策略,从而达到更优的策略选择。对博弈求均衡是算法博弈论的一个重要内容,这里介绍一个经典的求均衡算法:Fictitious Play(虚拟对弈)。c. 对手也进行相同的步骤,根据玩家的策略估计选择最佳响应策略,并更新对手的策略。a. 玩家观察对手的策略,并根据对手策略的估计选择自己的最佳响应策略。的最佳响应动作的集合。
2023-07-14 17:33:26
800
3
原创 Windows下安装星际争霸2的多智能体强化学习平台pymarl
主体框架参考https://blog.youkuaiyun.com/xyp99/article/details/108718906.安装环境windows10, CPU only安装步骤1. StarCraft Ⅱ安装,约30G。建议一路默认安装,否则之后需要改变python库文件代码。2. 创建conda环境conda create -n pymarl python=3.7 -y conda activate pymarl 注意事项:如果执行conda create -n pym...
2020-12-10 14:42:02
3985
7
原创 “conda activate“错误的一个解决之道
如果出现以下问题:CommandNotFoundError: Your shell has not been properly configured to use 'conda activate'.If using 'conda activate' from a batch script, change yourinvocation to 'CALL conda.bat activate'.To initialize your shell, run $ conda init <
2020-12-09 20:28:19
4139
6
转载 CondaHTTPError的解决之道
转载一篇文章(https://blog.youkuaiyun.com/u013383596/article/details/87718472), 因为我的问题真的得到了解决, 希望更多人可以看到.CondaHTTPError: HTTP 000 CONNECTION FAILED for url https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/noarch/repodata.jsonElapsed: -使用conda 创建虚拟环境报错,首先切换
2020-12-09 19:46:23
476
原创 SVD++中implicit feedback权重设置的思考
在SVD++中,loss function如下所示:其中一个问题是:为什么要将implicit feedback权重w设置为:我认为原因是:1,据作者Koren言,之前的模型中implicit feedback权重w是设置为1的,即|N(u)|的0次方,但是实验表明过多地依赖heavy rater效果并不好,所以需减小权重w。2,如果权重w设置为1/|N(u)|,即|N(u)|的-1次方,又感觉没...
2018-05-01 11:44:03
311
原创 \mathbbm{1}带来的type3问题
问题描述: 投论文时,字体一般要求是type1或true type,今天编译文章时,突然发现生成的PDF文件中有type3字体,通过排查,发现问题出在\mathbbm{1}语句上。 解决方案: 首先,将\usepackage{bbm}替换为\usepackage{dsfont}。 最后,将\mathbbm{1}替换为\mathds{1}。
2017-12-25 15:20:18
4615
2
转载 多目标遗传算法NSGA
多目标遗传算法NSGA因所读的一篇论文中,为了解决多目标的最优解问题,作者使用了一种称为NSGA-II(Improved Non-dominated Sorting Genetic Algorithm)的遗传算法,花了两天时间了解下,此为何物。其中NSGA以及NSGA-II的原理说明内容大部分取自2008年李莉的硕士论文《基于遗传算法的多目标寻优策略的应用研究》,故将此文定为转载。首先需要了解一种称
2017-05-01 22:19:47
32399
2
原创 关于const
关于const的使用1,const int bufsize = 512;表示,bufsize是整型常量,所有用const修饰的对象必须在定义时,就进行初始化,否则编译出错,且初始化后,该值就不能进行修改了。2,const int *ptr;表示,ptr是一个指向整型常量对象的指针,即const与int是描述ptr所指对象的信息,这意味着ptr本身是可以变化的,但是间接引用ptr是不
2013-12-29 20:39:28
524
原创 ubuntu12.04背景颜色设置
shell默认的紫色背景,我表示不是很喜欢,所以就把它改掉吧!1,打开终端2,点击"编辑"->"配置文件首选项"->"颜色",选择"自定义",这样就可以自己设置背景和文本颜色了下面推荐一下我的配色方案:将背景颜色设置为#3F3F3F,本颜色为纯白。
2013-12-10 11:32:24
657
原创 ubuntu12.04连接显示器
在ubuntu下连接显示器投影仪不像windows下那样方便,需要进行一些设置,下面我将使用xrandr命令来完成这项操作。本文主要参考了http://www.2cto.com/os/201211/168387.html机器:ThinkPad E430c系统:ubuntu12.04LTS首先将显示器的VGA插口与笔记本相连在shell中输入:xrandrScreen 0:
2013-12-05 18:48:59
1217
转载 (转)Linux下SSH使用指南
原文出自http://blog.chinaunix.net/uid-23399063-id-70131.html,觉得写得很不错,故转载之。SSH传统的网络服务程序,如FTP,POP,TELNET等在本质上都是不安全的,因为他们在网络上使用明文传送口令和数据.别有用心的人非常容易截获这些口令和数据.而且这些服务程序的安全验证方式也是有弱点的.就是很容易收到"中间人"冒充真正服务
2013-11-26 15:09:01
1537
原创 lseek的一些小细节
如果文件是使用O_APPEND打开的,那么无论怎样使用lseek来设置文件的偏移量,使用write函数来写文件时,都是从文件尾开始的,反之,文件不注明用O_APPEND打开,那么就可以使用lseek来设置偏移量,从而在新的偏移量下进行写文件,这样就可以产生APUE示例程序3-2中的空洞文件。这些只是我个人的体会,若有错误,望见谅,更希望您告诉我。
2013-01-07 15:50:41
412
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人