强化学习
一一张xi
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【深度学习笔记】task4 网络八股扩展
深度学习4.1 搭建网络八股概览4.2 自制数据集,解决本领域问题4.2 数据增强,扩充数据集4.3 断点续训,存取模型4.4 参数提取,把参数存入文本4.6 acc&loss可视化,查看训练效果4.6 应用程序,给图识物 4.1 搭建网络八股概览 4.2 自制数据集,解决本领域问题 原有数据如下,已经有了手写数字图片和txt文件,txt文件中记录了手写图片的文件名和其对应的标签 在这里插入代码片 目标:把图片路径和标签文件输入generateds,generateds函数返回输入特征和标签 i原创 2020-10-27 21:19:31 · 336 阅读 · 0 评论 -
【深度学习笔记】task3 神经网络八股
深度学习3.1搭建神经网络八股sequential3.1.1 Sequential3.2.2 compile配置神经网络训练方法 依依旧是跟着曹健老师的课程学习,终于来到精华部分了,之前又臭又长的代码们get out https://www.bilibili.com/video/BV1B7411L7Qt?p=1 原码见https://github.com/jlff/tf2_notes 目录 3.1搭建神经网络八股sequential 六步法 import相关模块,import 指定训练集测试集的输入和其原创 2020-10-26 20:56:28 · 1190 阅读 · 3 评论 -
【强化学习】task2 马尔科夫决策过程
强化学习第二章2.1 马尔科夫链2.2 马尔科夫奖励过程2.3 马尔科夫决策过程2.4 马尔科夫链马尔科夫奖励马尔科夫决策区别 目录 第二章 马尔科夫决策是强化学习中最常见的一种框架 2.1 马尔科夫链 一个状态满足马尔科夫转移指的是对于一个状态只取决于它前一个的状态而与其他状态无关 图中描述了一个状态到达其他状态的概率 对于上面这样的一个图可以用状态转移矩阵来表示 每一行代表了从一个节点到达其他节点的概率 马尔科夫例子 2.2 马尔科夫奖励过程 马尔科夫奖励过程=马尔科夫链+马尔科夫奖励过程 多了原创 2020-10-23 22:15:52 · 234 阅读 · 0 评论 -
【强化学习入门】 task1 概括与基础
强化学习入门 task1 概括与基础1. 1 什么是强化学习1.2 强化学习应用1.3 强化学习发展的原因1.4 奖励函数1.5 强化学习组成成分 主要根据周博磊教授的教学视频进行学习整理 视频地址https://www.bilibili.com/video/BV1LE411G7Xj 课程资料 https://github.com/zhoubolei/introRL 课件 https://github.com/zhoubolei/introRL/blob/master/lecture1.pdf 作者介绍原创 2020-10-20 22:10:00 · 339 阅读 · 0 评论
分享