- 博客(12)
- 收藏
- 关注
原创 pytorch BUG解决 nllloss expected long but int found
问题是,nllloss expected long but int found, #2 target should be long type当进行分类时,若使用cross_entropy,它会要求labels是long的类型。所以上网查了很多,解决方案大多是两种:假设输入是a = torch.tensor([1., 2, 3])此时,a是torch.float类型。1. 使用a.to(torch.long)2. 使用a.long()这两种方法的确可以转换类型为long(或者.
2022-08-03 12:44:47
206
原创 问题解决-pytorch: nllloss expected long but int found, #2 target
问题是,nllloss expected long but int found, #2 target should be long type当进行分类时,若使用cross_entropy,它会要求labels是long的类型。所以上网查了很多,解决方案大多是两种:假设输入是a = torch.tensor([1., 2, 3])此时,a是torch.float类型。1. 使用a.to(torch.long)2. 使用a.long()这两种方法的确可以转换类型为long(或..
2022-01-18 14:20:05
940
转载 [Distributed Training]强化学习并行训练论文合集
仅供自己参考学习使用。原文地址:https://zhuanlan.zhihu.com/p/77976582github:https://github.com/PaddlePaddle/PARL/blob/develop/papers/archive.md#distributed-training整体介绍强化学习需要的数据量其实是相当大的,在15年DQN发布的时候,要复现论文指标得和游戏交互10000000步。这个数量级在持续增长,deepmind 在训练AlphaGo的时候也是使用了上百块G
2020-09-05 11:28:48
670
转载 [model-free] 经典强化学习论文合集
仅供自己参考学习使用,如果有问题或者觉得内容不错,请去原文作者处点赞和讨论,谢谢。原文地址:https://zhuanlan.zhihu.com/p/89058164github:https://github.com/PaddlePaddle/PARL/blob/develop/papers/archive.md整体介绍这篇文章主要介绍经典的model-free 算法。对刚接触强化学习,然后又想深入了解RL的同学来说,是一个很好的论文合集。文章涵盖了首次用神经网络结合强化学习的D..
2020-09-05 11:26:29
427
转载 [Model-based]基于模型的强化学习论文合集
原文地址:https://zhuanlan.zhihu.com/p/72642285github:https://github.com/PaddlePaddle/PARL/blob/develop/papers/archive.md#model-based-rl仅供自己参考学习使用,如果有问题或者觉得内容不错,请去原文作者处点赞和讨论,谢谢。[背景]阻碍强化学习落地的致命缺点强化学习近些年在控制领域取得了相当大的突破,比如超越人类玩家平均水平的DQN算法,以及碾压所有人类选手的Alp..
2020-09-05 11:25:00
839
转载 RL算法改进汇总(会议)-2020
原文作者:https://www.zhihu.com/people/zhou-bo-54-20/postsgithub:https://github.com/PaddlePaddle/PARL/tree/develop/papers一、AAAI1. Proximal Distilled Evolutionary Reinforcement LearningCristian Bodnar, Ben Day, Pietro Lio ́简述:近期比较关注进化学习在强化学习问题上的应..
2020-09-05 11:06:35
1038
原创 2020-09-05 部分会议
16 ICML: International Conference on Machine Learning 领域顶级国际会议,录取率25%左右,2年一次,目前完全国内论文很少 机器学习,模式识别 17 NIPS: Neural Information Processing Systems 领域顶级国际会议,录取率20%左右,每年一次,目前完全国内论文极少(不超过5篇) ...
2020-09-05 10:26:26
290
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人