自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 强化学习之多臂老虎机(Multi-Armed-Bandit)问题

一、问题背景假设有一个老虎机有 nnn 个握把,每个握把 iii 有 PiPiP_i 的概率可以中奖,每次可以选择一个握把进行尝试,老虎机只会返回是否中奖。尝试者不知道中奖概率,需要通过有策略的尝试,选出中奖概率最高的那一个握把。二、问题抽象共有 nnn 个arm,每个arm的成功概率为 PiPiP_i 玩家可以对每个arm进行尝试,每次尝试后,若成功则得到1,若失败则得到0。玩家...

2018-08-08 10:58:46 7317 2

原创 通过简单的强化学习实现井字棋(Tic-Tac-Toe)

一、强化学习简介强化学习的过程可以理解为Agent与Environment的交互、学习、进步的过程,在井字棋中,可以简单的将其中的一方理解为Agent,另一方为Environment。交互的过程中主要有一下4个要素:状态(state):指可能出现的情况或局面,在井字棋中指局面上的落子情况与先后手。操作(action):指从一个状态(state)到另一个状态(state)的过程,在井字棋...

2018-08-03 13:33:22 9823 10

原创 Python学习笔记(三):进程与线程

一、进程(process)在Python中,进程的主要模块为subprocess模块,此模块旨在代替老的os.system,os.spawn*,os.popen*,popen2,commands模块,进一步减少编程人员的工作量,实现import this中体现的宗旨。附上官方文档链接:https://docs.python.org/3/library/subprocess.html

2017-02-01 20:30:55 1068

原创 Python学习笔记(二):文件读写

一、魔数这里的魔数并非程序猿随便定义的魔数。对于很多类型的文件,其起始的几个字节的内容是固定的(或是有意填充,或是本就如此)。根据这几个字节的内容就可以确定文件类型,因此这几个字节的内容被称为魔数 (magic number)。【百度百科】在Python 中同样也可以使用魔数判断一个文件的类型,例如是否被压缩。例如以下代码:import gzipimport pick

2017-01-16 12:04:40 722

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除