自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

LeeHiking的博客

机器智能、机器学习

  • 博客(5)
  • 收藏
  • 关注

原创 码云(gitee)结合vscode进行代码管理和问题解决

码云(gitee)结合vscode进行代码管理和问题解决 路线 注册码云(gitee) 安装git 安装vscode 连接码云进行代码管理 常见问题解决 准备 注册码云: 进入码云官网进行注册,官网地址:https://gitee.com/,按照官网说明一步步做即可,记住用户名密码。 安装git: 直接git官网下载,无脑next安装即可。 下载连接:https://git-scm.com/downloads 安装vscode: 直接官网下载,然后无脑next安装。 下载连接: 连接码云进行代码管理 登

2021-03-16 20:39:02 1539

转载 Deep Q Network (DQN)(extend)

Double DQN (Tensorflow) 要点 本篇教程是基于 Deep Q network (DQN) 的选学教程. 以下教程缩减了在 DQN 方面的介绍, 着重强调 Double DQN 和 DQN 在代码上不同的地方. 所以还没了解 DQN 的同学们, 有关于 DQN 的知识, 请从 这个视频 和 这个Python教程 开始学习. 接下来我们说说为什么会有 Double DQN 这种算...

2021-03-16 19:43:21 341

转载 Deep Q Network (DQN)(base)

什么是DQN 今天我们会来说说强化学习中的一种强大武器, Deep Q Network 简称为 DQN. Google Deep mind 团队就是靠着这 DQN 使计算机玩电动玩得比我们还厉害. 注: 本文不会涉及数学推导. 大家可以在很多其他地方找到优秀的数学推导文章. 强化学习与神经网络 之前我们所谈论到的强化学习方法都是比较传统的方式, 而如今, 随着机器学习在日常生活中的各种应用, 各种...

2021-03-16 19:42:38 522

转载 Sarsa

今天我们会来说说强化学习中一个和 Q learning 类似的算法, 叫做 Sarsa. 注: 本文不会涉及数学推导. 大家可以在很多其他地方找到优秀的数学推导文章. 在强化学习中 Sarsa 和 Q learning 及其类似, 这节内容会基于之前我们所讲的 Q learning. 所以还不熟悉 Q learning 的朋友们, 请前往我制作的 Q learning 简介 (知乎专栏). 我们...

2019-09-29 14:38:54 628 1

转载 Q Learning

行为准则 : 好的行为 -> 得到奖励 坏的行为 -> 没有奖励,还有惩罚 比如小时候爸妈常说”不写完作业就不准看电视”. 所以我们在 写作业的这种状态下, 好的行为就是继续写作业, 直到写完它, 我们还可以得到奖励, 不好的行为 就是没写完就跑去看电视了, 被爸妈发现, 后果很严重. Q learning 也是一个决策过程, 和小时候的这种情况差不多. 我们举例说明. 假设现在我们处...

2019-09-28 17:30:21 559 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除