图像分割--PixelNet: Representation of the pixels, by the pixels, and for the pixels

PixelNet是一种统一的网络模型,能够处理从边缘检测到表面法线估计再到语义分割等不同层次的像素级预测任务。该模型通过采用VGG-16卷积特征,并结合特定的采样策略进行训练,实现在多种任务上的高效表现。

PixelNet: Representation of the pixels, by the pixels, and for the pixels
Code: https://github.com/aayushbansal/PixelNet
http://www.cs.cmu.edu/~aayushb/pixelNet/

从低层次的边缘检测到中层次的 surface normal estimation 到高层次的 semantic segmentation,针对广义的像素级别预测问题,我们探索其内在设计原理,提出了一个单网络结构模型解决这些问题。

这里写图片描述

我们的网络结构如下:
这里写图片描述

我们首先使用VGG-16卷积提取卷积特征,对一个采样的像素点,从多个卷积特征图上提取对应的特征,建立 hypercolumn descriptor,然后将该特征输入到一个MLP多层感知器,最后输入分类结果。
这里写图片描述

本文主要的思想在于训练时候的采样策略,加速训练。提出基于像素的 stratified sampling, sparse sampling
这里写图片描述

我们发现从训练图像中采样很少的像素就可以得到很好的结果。

这里写图片描述

实验显示我们的网络模型在 semantic segmentation, surface normal estimation, edge detection 效果都很好。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值