
Object Detection
TWSF
敏而好学,不耻下问
展开
-
FCOS (ICCV2019)
总结:1. 相当于换了一种形式的anchor, 多层预测, 每层预测指定的尺寸, 然后使用si(也没有讲这个是怎么来的)来平衡尺寸基数.2. 主要困难点在于目标之间overlap的处理 和 尺寸不变形问题, 可以说两者都是通过FPN处理的,前者假设多数overlap的目标都是尺寸差距较大的, 后者通过每层限定回归范围以及设置si来平衡.3. ICCV2019的, 整篇读下来很顺畅,...原创 2019-10-13 16:42:45 · 476 阅读 · 0 评论 -
FCOS (ICCV2019)
总结:1. 相当于换了一种形式的anchor, 多层预测, 每层预测指定的尺寸, 然后使用si(也没有讲这个是怎么来的)来平衡尺寸基数.2. 主要困难点在于目标之间overlap的处理 和 尺寸不变形问题, 可以说两者都是通过FPN处理的,前者假设多数overlap的目标都是尺寸差距较大的, 后者通过每层限定回归范围以及设置si来平衡.3. ICCV2019的, 整篇读下来很顺畅,...原创 2019-10-13 16:41:57 · 473 阅读 · 0 评论 -
NMS: 非极大值抑制
之前总是对这个东西理解错, 后来看了一遍code, 这次应该不会错~~自己的理解:在nms之前先进行一个大的top-N, nms之后在进行一个恰当的top-N, 这样可以非常好~因为如果不进行后面的top-n 之前过大, 那么后面就可能很多, 之前过小, 那么后面可能就没几个了1. 把框的信息和对应的目标得分传给函数(这里都是目标分数, 多少框多少分数, 不是背景的分数, 仅...原创 2019-06-08 16:04:36 · 317 阅读 · 0 评论 -
SNIPER: Efficient Multi-Scale Training
conclusion:主要针对小目标检测, 没有提出新的检测算法, 仅仅是对输入图像的一个采样策略.主要思想是尽量让输入训练的一张图像里面的各个目标的尺度在一个范围内, 不要相差太大从而提升性能, 并且不要让那些无关的背景区域也过多的参与训练从而提高效率主要方法是图像金字塔, 定义chip, 就像是滑动窗口, 然后选出一些目标多的窗口chip(对于图像金字塔的每个尺度计算的目标也限定在...原创 2019-06-27 19:47:46 · 348 阅读 · 0 评论