- 博客(7)
- 资源 (5)
- 收藏
- 关注
原创 RNN 网络结构及训练过程简介
本文通过整理李宏毅老师的机器学习教程的内容,简要介绍 RNN(recurrent neural network)的网络结构及训练过程。
2023-11-25 23:44:42
1497
1
原创 反向传播法(backpropagation)的基本原理
本文通过整理李宏毅老师的机器学习教程的内容,介绍神经网络中用于更新参数的反向传播法(backpropagation)的基本原理。
2023-10-25 16:57:53
539
原创 actor-critic 相关算法简述
asynchronous advantage actor-critic(A3C);pathwise derivative policy gradient;actor-critic 与 GAN 的关系
2022-03-15 22:17:16
2527
原创 近端策略优化(proximal policy optimization)算法简述
本文通过整理李宏毅老师的机器学习教程的内容,简要介绍深度强化学习(deep reinforcement learning)中的近端策略优化算法(proximal policy optimization)。
2022-02-26 20:20:18
8572
1
原创 策略梯度法(policy gradient)算法简述
本文通过整理李宏毅老师的机器学习教程的内容,简要介绍深度强化学习(deep reinforcement learning)中的策略梯度法(policy gradient)。
2022-01-16 22:31:10
7146
2
Certificates of Primal or Dual Infeasibility.pdf
2020-10-16
leaflet.pdf
2020-06-17
leaflet.extras.pdf
2020-06-17
2017, Sean J. Taylor, Benjamin Letham, Forecasting at Scale.pdf
2021-03-17
self-attention 讲义, 李宏毅, 2021
2023-11-27
transformer 讲义, 李宏毅, 2021
2023-11-27
p-hacking paper
2023-07-16
Honey Bee Swarm algorithm paper
2023-07-16
Farkas alternative and Duality Theorem.pdf
2020-07-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅