
ML/RL学习摘要
机器学习
zaker123
永远年轻,永远热泪盈眶!
展开
-
深度增强学习PPO(Proximal Policy Optimization)算法源码走读
版权声明:本文为博主原创文章,只要标明出处即可转载。 https://blog.youkuaiyun.com/ariesjzj/article/details/80417179 原文地址:https://blog.youkuaiyun.com/jinzhuojun/article/deta...转载 2018-10-12 12:51:28 · 1606 阅读 · 0 评论 -
一文搞懂交叉熵在机器学习中的使用,透彻理解交叉熵背后的直觉
版权声明:本文为博主原创文章,转载请注明出处。 https://blog.youkuaiyun.com/tsyccnh/article/details/79163834 关于交叉熵在loss函数中使用的理解交叉熵(cross entropy)是深度学习中常用的一个概念,一般用...转载 2018-10-29 16:33:08 · 240 阅读 · 0 评论