
ReinforcementLearning
htfenght
这个作者很懒,什么都没留下…
展开
-
强化学习
机器学习算法完整版见fenghaootong-github 强化学习原理(RL) RL与有监督学习、无监督学习的比较: 有监督的学习是从一个已经标记的训练集中进行学习,训练集中每一个样本的特征可以视为是对该situation的描述,而其label可以视为是应该执行的正确的action,但是有监督的学习不能学习交互的情景,因为在交互的问题中获得期望行为的样例是非常不实际的,agen...原创 2018-03-08 10:58:13 · 1063 阅读 · 0 评论 -
强化学习实例
机器学习算法完整版见fenghaootong-github 强化学习应用实例 导入模块 # -*- coding: utf-8 -*- import numpy as np import pandas as pd import time 设置参数 #产生伪随机数列 np.random.seed(2) N_STATES = 6 ACTIONS = ['left', 'right'...转载 2018-03-08 10:56:44 · 3799 阅读 · 0 评论