【论文笔记-Stereo】Pyramid Stereo Matching Network

本文深入探讨了Pyramid Stereo Matching Network的论文思想,包括使用ResNet进行特征提取,通过dilated convolution扩大感受野,以及利用Pyramid Pooling Module获取全局上下文信息。文章还详细介绍了构建feature volume的过程,以及如何使用stacked hourglass 3D CNN处理cost volume,并结合不同的hourglass输出计算加权损失。此外,论文中采用了end-to-end的立体估计方法,并在KITTI数据集上取得了最佳成果。笔记部分则涵盖了视差计算的回归方法和应用smooth_l1_loss作为损失函数的原因。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

论文思想

  1. 使用ResNet提取特征
  2. 用dilated convolution增大感受野
  3. 用Pyramid pooling module,提取各个scale的特征,使之包含global的context信息
  4. 用feature volume shift构建volume
  5. 用stacked hourglass 3D CNN(encoder-decoder)来处理cost volume,在训练过程中使用不同层级的hourglass的输出算加权loss
  6. end-to-end stereo estimation
  7. 在KITTI上取得了当时最好的结果

笔记

结构

architecture

cost_volume

disparity_learning

这里写图片描述

视差计算(回归方法)

DIsparity regression

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值