Context Encoders: Feature Learning by Inpainting 论文笔记

本文介绍了深度学习模型Context Encoder(CE)在图像修复任务中的应用。该模型采用编码器-解码器架构,通过AlexNet的卷积层提取特征,使用通道全连接层减少计算量。解码器通过反卷积和上采样恢复图像。损失函数包括重建损失和对抗损失,以确保修复的图像既符合结构一致性又显得自然。在训练过程中,模型与判别器共同优化,实现图像细节的精确恢复。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Computer Vision and Pattern Recognition Nov 2016
会议与时间:Computer Vision

该网络简称CE,模型的整体架构是一个编码器-解码器。

模型搭建

网络结构

  • Encoder由卷积层组成(从AlexNet中分离出来的),用于提取多个feature map。 227 × 227 227\times227 227×227编码到 6 × 6 × 256 6\times6\times256 6×6×256
  • 全连接层用于在多个feature map之间传递信息(光使用Encoder的卷积层无法在一个特征图中连接所有位置)。

为了减少计算量,本网络使用的是通道全连接层。即对于多张特征图,不是一股脑的把它们全连接起来,而是每个特征图分别连接。
这样的话,假如有m个 n × n n\times n n×n的特征图,那么参数量就从原来的 m 2 n 4 m^2n^4 m2n4缩小为 m n 4 mn^4 mn

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值