FCN全卷积神经网络

     FCN是在CNN基础上的发展和延申。CNN的强大之处在于它的多层神经网络结构能够自动学习影像的深层次特征。同时CNN的局部感知、权值共享、下采样的特点,是学习到的特征具有平移、旋转、缩放不变性,这保证了网络结构能够适应不同形态的二维图像,更重要的是,它能够学习影像中由于拍摄角度不同、尺度不同等原因造成的地物不同形态的特征,有利于提高影像的分类i精度。然而CNN的下采样会降低影像分辨率,丢失细节信息,输出的结果通常是待分类图像属于某一类别的概率向量值,且CNN的全连接层中的向量长度是固定的,限制了输入图像的尺寸也必须是固定值。

       针对CNN的缺点,FCN提出,用于解决图像语义分割方面的问题。图像语义分割是计算机视觉领域的重要概念,是指将像素根据图像中表达的语义信息的不同进行分组或分割,从而对图像上的每个像素点实现语义标注。图像语义分割即影像的分类。因此FCN能够确定影像中每一个像素的类别,不仅能够识别像素“是什么”,还能够定位像素“在哪里”,实现了从CNN图像级别的分类进一步延伸到像素级别的分类。

 

FCN的原理  

       FCN与CNN在结构上的区别如下图所示。图a表示一个CNN结构,假设针对一个6分类问题,输入层的图像尺寸为128*128,经过2个卷积层和1个池化层,再与2个全连接层相连,全连接层将二维特征图映射成固定长度的特征向量,最后输出一个6维向量,向量中的概率值分别表示输入图片属于每一类的概率,概率最大的值为预测的分类结果。在利用CNN进行影像分类时通常采用的思路是利用滑动窗口遍历整张待分类影像,将得到的小图像块作为输入图像进行训练和预测,每个图像块中心像素的类别即为该图像块的类别,最后整合所有类别结果得到整张影像的分类结果图。这种方法存在缺点:(1)计算效率低,滑动窗口得到的图像块存在大量重复,对每个图像块进行训练得到分类结果,浪费计算资源且计算缓慢;(2)存储量大,针对每一个像素点的分类,均需要存储一个图像块,使得存储空间成倍增长;(3)感知区域有限,图像块的尺寸限制了感知区域的大

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值