【阅读笔记】《Learning to Segment Object Candidates》(DeepMask)

本文记录了博主阅读论文《Learning to Segment Object Candidates》的笔记,代码,更新于2019.05.31。

Abstract

目前的目标检测系统主要包括两步:(1)尽量高效地提出一组可能目标的候选;(2)将这些候选送入一个分类器。本文中提出了一种生成目标候选的新方法,包括基于判别卷积网络(discriminative convolutional network)的一个方法。网络的训练同时在两个共同的目的下进行:给定图块,系统的第一部分输出一个不区分类别的分割mask,第二部分则输出这个图块处于一个完整目标中间的概率。在测试过程中,模型可以高效地应用在整个测试图上,并且生成一系列分割mask,每个都分配了对应的目标可能性score。模型也可以范化到未见过的类别。与之前的生成目标mask的方法不同,本文的方法不需要依赖于边界、超像素或其他底层分割(low-level segmentation)。

Introduction

Related Work

DeepMask Proposals

给定一个输入图块,本文所提网络能够估计一个分割mask,并给每个图块分配一个其包含目标的可能性。

mask和score估计是同时用一个卷积网络实现的,只有网络的最后几层有不同。具体如下图所示:
在这里插入图片描述
在训练过程中,两个任务同时训练。相比较用两个模型完成两个任务的网络,这个结构能够减小网络规模并提升测试时的速度。

每个样本训练集中的 k k k都需要包含三样东西:(1)RGB图块 x k x_k xk;(2)对应输入图块的二进制mask m k m_k mk(其中 m k i j ∈ { ± 1 } m_k^{ij}\in\{\pm1\} mkij{ ±1} ( i , j ) (i,j) (i,j)对应于每个像素在输入图块中的位置);(3)标注 y ∈ { ± 1 } y\in\{\pm1\} y{ ±1},声明图块中是否包含目标。具体而言,一个图块 x k x_k xk在给定了标签 y k = 1 y_k=1 yk=1时,需要满足下面的限制:

  1. 图块包含一个目标且目标在图块中心附近;
  2. 目标在指定尺度范围内完全存在于图块中。

否则, y k = − 1 y_k=-1 yk=1,即使目标部分出现。实验中用的位置和尺度的容忍度稍后给出。假设 y k = 1 y_k=1 yk=1,真值mask m k m_k

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值