受分割网络的启发,利用Encoder-Decoder结构,全局上下文信息,是一种轻量级(Light-weight)的网络,用了多尺度特性,基于VGG16骨干网络来实现。在上采样时,使用bilinear缩放+3×3Conv代替简单的bilinear内插或deconv,deconv会产生棋盘(checkerboard)效应。用KLD作为损失函数,KLD越小越好。
MSI-Net参考论文:Contextual Encoder-Decoder Network for Visual Saliency Prediction(A Kroner,2019)
最新推荐文章于 2025-04-19 22:22:33 发布
本文介绍了一种基于Encoder-Decoder结构的轻量级网络,利用全局上下文信息和多尺度特性,采用VGG16作为骨干网络。在上采样过程中,通过bilinear缩放加3×3Conv替代传统方法,避免了棋盘效应。使用KLD作为损失函数,旨在最小化误差。
1293

被折叠的 条评论
为什么被折叠?



