
Reinforcement learning
勤劳的凌菲
Try my best! Do myself~~
展开
-
通过 Q-learning 深入理解强化学习
本文将带你学习经典强化学习算法 Q-learning 的相关知识。在这篇文章中,你将学到:(1)Q-learning 的概念解释和算法详解;(2)通过 Numpy 实现 Q-learning。 原文链接:http://baijiahao.baidu.com/s?id=1597978859962737001&wfr=spider&for=pc 故事案例:骑士和公主 假设你是一名...转载 2019-01-22 09:24:50 · 601 阅读 · 0 评论 -
FreeAnchor: Learning to Match Anchors for Visual Object Detection论文详解
问题 在基于anchor的目标检测算法中,训练时,通常通过anchor和真实object 框之间的IoU来决定该anchor是否用来预测object (包括类别和位置),通常IoU超过某一阈值则认为该anchor为正例(即作为预测object ),小于某一阈值则认为该anchor为背景。本文的思想就是通过修改loss函数去除人工参与指定anchor的过程,使网络能够自主学习选择哪个anchor和真...原创 2019-09-18 20:16:57 · 1452 阅读 · 2 评论