
StereoVoxelNet: Real-Time Obstacle Detection Based on Occupancy Voxels From a Stereo Camera Using Deep Neural Networks
Project page:https://lhy.xyz/stereovoxelnet/
code:https://github.com/RIVeR-Lab/stereovoxelnet
ICRA-2023
文章目录
1、Background and Motivation
在机器人导航领域,障碍物检测是确保机器人安全、高效移动的关键技术。
传统的立体匹配方法虽然被广泛应用,但往往受限于计算效率和精度之间的平衡。(dense depth information produced is redundant)
随着深度学习技术的发展,基于深度神经网络的立体匹配模型在计算机视觉领域取得了显著成果,但在实时性和鲁棒性方面仍面临挑战,特别是在资源受限的机器人平台上。
动机:本文旨在提出一种计算高效且鲁棒的实时障碍物检测方法,利用深度神经网络直接从立体图像对中检测占用体素(occupancy voxels),从而克服传统方法的局限性,推动机器人感知系统向更高级别的自动化和智能化发展。
2、Related Work
立体摄像头在机器人导航中的应用历史悠久,主要依赖于经典的立体匹配算法,如半全局匹配(SGM)。
近年来,深度学习端到端模型逐渐兴起,试图通过学习直接预测视差图或深度图。
然而,这些方法在实时性和鲁棒性方面仍存在不足,尤其是在处理动态和未知环境时。
关键问题:现有方法要么牺牲精度以满足实时性要求,要么在复杂环境中鲁棒性不足。
此外,基于深度学习的立体模型在计算资源受限的机器人平台上部署时面临巨大挑战。
(1)Obstacle detection using the stereo camera
- Semi-global Matching (SGM)
- Pushbroom Stereo
- DroNet(poor domain adaptation)
可能不高效,因为深度图往往预测每个像素,obstacles typically account for only a small portion of pixels
作者的方法摒弃了不高效的 depth estimation-related modules
Hirschmuller H. Accurate and efficient stereo processing by semi-global matching and mutual information[C]//2005 IEEE computer society conference on computer vision and pattern recognition (CVPR’05). IEEE, 2005, 2: 807-814.
(2)Stereo matching
end-to-end network to predict the disparity map from a stereo pair
Žbontar J, LeCun Y. Stereo matching by training a convolutional neural network to compare image patches[J]. Journal of Machine Learning Research, 2016, 17(65): 1-32.
(3)Octree representation




最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



