Deeplabv3+ 阅读笔记

本文是Deeplabv3+的阅读笔记,重点探讨了Spatial Pyramid Pooling如何探查不同尺度特征,以及Encoder-Decoder结构如何逐步恢复空间信息,实现更清晰的边界捕捉。此外,还提到了深度可分离卷积(Depthwise Separable Convolution)的作用,并介绍了其与常规卷积的区别。Deeplabv3+的解码器模块对于细化分割结果,尤其是物体边界精细化处理有显著贡献。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Notes: 谷歌deeplabv3+的代码现在已经开源,详见deeplab(Github),还有一个使用的demo样例。

0.
spatial pyramid pooling
  • probing the incoming features with filters or pooling operations at multiple rates and multiple effective fields-of-view
  • encode multi-scale contextual information
encode-decoder
  • gradually recovering the spatial information
  • capture sharper object boundaries
convolution
  • depthwise convolution: a spatial convolution performed independently over each channel of an input
  • pointwise convolution: a 1x1 convolution, projecting the channels output by the depthwise convolution onto a new channel s
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值