自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

qq_22749225的博客

原创神经网络训练无效果的原因分析

机器学习：神经网络训练无效果的原因分析

2022-07-13 15:30:22 1667

原创李宏毅2021/2022春机器学习课程（机器学习基本概念简介）

李宏毅老师的机器学习课程内容

2022-07-10 09:31:46 1321

原创模仿学习（Imitation Learning）概述

什么是模仿学习呢？简单来说，模仿学习（Imitation Learning），就是要训练机器能够复制人类的连续动作，进而达到模仿的目的。其实，Imitation Learning的实用性很高，假设今天有一个训练场景，你不知道该怎么定奖励值（reward），但是你可以收集到专家的示范数据（expert demonstration data），你就可以考虑用Imitation Learning这个方法。因此，模仿学习也被寄予很高的期待，成为下一代强人工智能的关键技术。......

2022-07-07 19:50:07 23493

原创李宏毅深度强化学习(国语)课程(2018) 笔记（八）Imitation Learning

李宏毅深度强化学习(国语)课程(2018) 笔记（八）Imitation Learning

2022-07-06 10:14:31 274

原创李宏毅深度强化学习(国语)课程(2018) 笔记（七）Sparce Reward

李宏毅深度强化学习(国语)课程(2018) 笔记（七）Sparce Reward

2022-07-05 10:51:10 209

原创李宏毅深度强化学习(国语)课程(2018) 笔记（六）Actor-Critic

李宏毅深度强化学习(国语)课程(2018) 笔记（六）Actor-Critic

2022-07-03 11:25:19 318

原创李宏毅深度强化学习(国语)课程(2018) 笔记（五）Q-learning （Continuous Action）

李宏毅深度强化学习(国语)课程(2018) 笔记（五）Q-learning （Continuous Action）

2022-07-02 09:49:23 248

原创李宏毅深度强化学习(国语)课程(2018) 笔记（四）Q-learning （Advanced Tips）

李宏毅深度强化学习(国语)课程(2018) 笔记（四）Q-learning （Advanced Tips）

2022-06-30 11:19:21 286

原创李宏毅深度强化学习(国语)课程(2018) 笔记（三）Q-learning （Basic Idea）

李宏毅深度强化学习(国语)课程(2018) 笔记（三）Q-learning （Basic Idea）

2022-06-28 12:21:38 314

原创李宏毅深度强化学习(国语)课程(2018) 笔记（二）Proximal Policy Optimization（PPO）

李宏毅深度强化学习(国语)课程(2018) 笔记（二）Proximal Policy Optimization（PPO）

2022-06-27 20:48:21 634

原创李宏毅深度强化学习(国语)课程(2018) 笔记（一）Policy Gradient （Review）

李宏毅深度强化学习(国语)课程(2018) 笔记

2022-06-26 23:21:48 873

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除