- 博客(36)
- 收藏
- 关注
原创 【强化学习】Policy Gradient-REINFORCE
强化学习:Policy Gradient-REINFORCE(CartPole-v1)
2024-01-15 17:17:58
987
原创 Pytorch_1_基础
PyTorch是一个使用PyTorch语言的神经网络库,PyTorch 在神经网络领域可替换numpy的模块。常用的两个神经网络库是Pytorch和Tensorflow,两者各有优劣。PytorchTensorflow优势动态神经网络如RNN变化时间长度的输出分布式训练劣势静态神经网络。
2023-11-29 17:05:00
82
原创 线搜索:黄金分割算法与Amijo Rule 算法
线搜索算法:黄金分割算法和Amijo Rule算法 Python代码(凌青老师的凸优化课上讲过的)
2023-07-20 16:11:46
260
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人