
AI
LoveChris_LL
这个作者很懒,什么都没留下…
展开
-
强化学习算法SAC的学习探究及基于百度PARL的实战
本文要点:SAC算法的理解 基于百度飞桨PARL的算法实战 个人学习心得 参考文献及学习资源1. SAC算法的理解 SAC即SoftActor-Critic(柔性致动/评价),它是一种基于off-policy和最大熵的深度强化学习算法,其由伯克利和谷歌大脑的研究人员提出。作为目前高效的model-free算法,SAC是深度强化学习中对于连续动作控制的又一经典algorithm,十分适用于真实世界中的机器人任务学习。 SAC基于最大熵强化学习框架,其中的熵增目标...原创 2020-07-24 19:36:50 · 2723 阅读 · 0 评论 -
强化学习算法研究与应用参考资料(不断更新中)
1. SACSAC是深度强化学习中对于连续动作控制的又一经典algorithm。近期简单的看了一下SAC算法的思想,先把当前的资料整理一波,便于进一步学习。后续再作进一步更新1.1文章讨论SAC强化学习算法 SACopenAI-soft actor-criticSoft Actor-Critic 论文笔记最前沿:深度解读Soft Actor-Critic 算法SAC Algorithms and Applications 附可复现代码知乎文章SAC全新的强化学习算法:柔性致动/评价(so原创 2020-07-24 13:54:01 · 374 阅读 · 0 评论 -
稠密特征加入CTR预估模型的方法
稠密特征一般是相对稀疏特征来说的,我们知道类别特征经过独热编码之后比较稀疏,比如类别 [‘小猫’,‘小狗’,‘小熊’,‘小猴’] 被独热编码后的数据结构为[[1,0,0,0],[0,1,0,0],[0,0,1,0],[0,0,0,1]],可以看到这种数据很稀疏,但是像桌子的长度这种稠密特征数据一般就是 [3.4,2.6,8.9,6.7] 这种。一般针对类别特征都是通过词嵌入的方法把稀疏特征转化为稠...原创 2020-01-02 23:00:53 · 461 阅读 · 0 评论