论文思想
- 使用ResNet提取特征
- 用dilated convolution增大感受野
- 用Pyramid pooling module,提取各个scale的特征,使之包含global的context信息
- 用feature volume shift构建volume
- 用stacked hourglass 3D CNN(encoder-decoder)来处理cost volume,在训练过程中使用不同层级的hourglass的输出算加权loss
- end-to-end stereo estimation
- 在KITTI上取得了当时最好的结果
笔记
结构
视差计算(回归方法)
DIsparity regression