空间映射网络--Spatial Transformer Networks

本文介绍了一种用于图像处理的技术——空间变换网络(Spatial Transformer Networks),该技术能够对图像中的目标进行检测并归一化,以解决角度和尺度变化带来的影响。文章详细解释了如何使用定位网络来获取目标的位置参数,并通过坐标映射实现图像归一化。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

转自:http://blog.youkuaiyun.com/zhangjunhit/article/details/67631762


Spatial Transformer Networks 
主要对目标在特征空间做不变性归一化 解决 角度、尺度等变形引入的影响 
Code: https://github.com/skaae/transformer_network

这里写图片描述

首先我们从图像上有个感性认识,对于一个输入图像,我们首先将目标检测出来,用一个四边形框住,然后将这个四边形里的目标图像进行归一化,最后对归一化的目标分类。

原理图如下所示: 
这里写图片描述

目标检测我们使用一个 定位网络, localisation network,这个网络可以是全链接网络也可以是一个卷积网络。但是最后应该有一个位置回归层,用于输出目标的空间参数信息。有了这个空间参数,我们通过坐标映射将目标进行归一化。得到标准大小的图像。最后使用这个归一化后的图像进行分类识别。 
定位网络和采样映射机制定义了一个空间映射网络。 
The combination of the localisation network and sampling mechanism defines a spatial transformer.

这里写图片描述


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值