18、计算机视觉技术：从视觉搜索到增强现实

最新推荐文章于 2025-12-03 22:42:02 发布

肥宅快乐水901

最新推荐文章于 2025-12-03 22:42:02 发布

阅读量14

点赞数

CC 4.0 BY-SA版权

分类专栏： OpenCV视觉实战指南文章标签：计算机视觉视觉搜索立体视觉

本文链接：https://blog.youkuaiyun.com/websocket5live/article/details/154641546

OpenCV视觉实战指南专栏收录该内容

31 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

计算机视觉技术：从视觉搜索到增强现实

视觉搜索引擎的构建

视觉搜索引擎能够接收输入图像，并展示与之相似的一系列图像。构建视觉搜索引擎可复用目标识别框架，具体步骤如下：
1. 从输入图像中提取特征向量。
2. 将该特征向量与训练数据集中的所有特征向量进行比较。
3. 挑选出匹配度最高的结果并展示。

在实际应用中，我们需要处理数十亿张图像，因此不能在展示输出前搜索每一张图像。为了确保搜索高效快速，有许多算法可供使用。深度学习在该领域得到了广泛应用，近年来展现出了巨大的潜力。深度学习是机器学习的一个分支，专注于学习数据的最优表示，使机器更易于学习新任务。你可以访问 http://deeplearning.net 了解更多相关信息。

立体视觉与 3D 重建

立体视觉和 3D 重建涉及多个重要概念，以下为你详细介绍：
1. 立体对应
- 当我们拍摄图像时，会将周围的 3D 世界投影到 2D 图像平面上，因此拍摄的照片仅包含 2D 信息，丢失了深度信息。
- 人类能够很好地从现实世界中推断深度信息，这是因为我们有两只眼睛，它们之间相隔几英寸。每只眼睛就像一台相机，从两个不同的视角捕捉同一场景的两张图像，大脑利用立体视觉构建 3D 地图。
- 我们可以利用立体视觉算法实现相同的效果，即从不同视角拍摄同一场景的两张照片，然后匹配对应点以获取场景的深度图。
- 通过实验可以发现，当物体靠近相机时，从不同角度拍摄的两张图像中物体位置的移动较小；而当物体远离相机时，物体位置的移动较大。这就是立体对应的概念，我们利用这一知识从给定场景中提取深度信息。