
强化学习
文章平均质量分 95
liaojq2020
这个作者很懒,什么都没留下…
展开
-
论文阅读——HEVC中用于动态视频序列基于强化学习的速率控制方法
一、文章出处本文题为《Rate Control Method Based on Deep Reinforcement Learning for Dynamic Video Sequences in HEVC》,文章链接:原文链接,加载过程较慢容易出现问题,提供资源分享下载链接:分享链接二、主要内容文章提出一种基于强化学习的 HEVC 速率控制算法,通过对 encoder 端帧内预测的决策过程分析与建模最终通过强化学习解决问题。1.一些概念① frame-level and CTU-levelI原创 2021-01-03 16:10:16 · 405 阅读 · 0 评论 -
论文阅读——应用于HEVC帧内预测速率控制的强化学习方法
文章提出一种基于强化学习的 HEVC 帧内预测速率控制算法,通过对 encoder 端帧内预测的决策过程分析与建模最终通过强化学习解决问题。原创 2020-12-31 16:38:54 · 285 阅读 · 1 评论 -
强化学习python代码实战:深度递归Q网络(Deep Recurrent Q-Network)解决gridworld(配详细代码注释)
DRQN (Deep Recurrent Q-Network) 是一种将 Q-network 和 RNN 结合解决部分可观测马尔可夫决策过程的方法,本文通过每句代码的详细注释,清楚的解释了通过 DQRN 算法解决强化学习中经典问题 gridworld 的方法,便于读者更好的学习强化学习、理解强化学习与深度学习和其他机器学习方法之间的关系。原创 2020-12-22 08:00:33 · 2304 阅读 · 4 评论 -
论文阅读——应用于HEVC视频编码器端控制的强化学习算法
一、文章出处本文题为《Reinforcement Learning for Video Encoder Control in HEVC》,文章链接:原文链接,加载过程较慢容易出现问题,提供资源分享下载链接:二、主要内容文章提出一种基于强化学习优化 HEVC encoder 端控制的算法,通过对 encoder 端决策过程分析与建模最终通过强化学习解决问题。1.一些概念① episodesWe view the encoding procedure as a sequence of recurr原创 2020-12-19 17:30:08 · 458 阅读 · 2 评论