18、计算机视觉技术:从视觉搜索到增强现实

计算机视觉技术:从视觉搜索到增强现实

视觉搜索引擎的构建

视觉搜索引擎能够接收输入图像,并展示与之相似的一系列图像。构建视觉搜索引擎可复用目标识别框架,具体步骤如下:
1. 从输入图像中提取特征向量。
2. 将该特征向量与训练数据集中的所有特征向量进行比较。
3. 挑选出匹配度最高的结果并展示。

在实际应用中,我们需要处理数十亿张图像,因此不能在展示输出前搜索每一张图像。为了确保搜索高效快速,有许多算法可供使用。深度学习在该领域得到了广泛应用,近年来展现出了巨大的潜力。深度学习是机器学习的一个分支,专注于学习数据的最优表示,使机器更易于学习新任务。你可以访问 http://deeplearning.net 了解更多相关信息。

立体视觉与 3D 重建

立体视觉和 3D 重建涉及多个重要概念,以下为你详细介绍:
1. 立体对应
- 当我们拍摄图像时,会将周围的 3D 世界投影到 2D 图像平面上,因此拍摄的照片仅包含 2D 信息,丢失了深度信息。
- 人类能够很好地从现实世界中推断深度信息,这是因为我们有两只眼睛,它们之间相隔几英寸。每只眼睛就像一台相机,从两个不同的视角捕捉同一场景的两张图像,大脑利用立体视觉构建 3D 地图。
- 我们可以利用立体视觉算法实现相同的效果,即从不同视角拍摄同一场景的两张照片,然后匹配对应点以获取场景的深度图。
- 通过实验可以发现,当物体靠近相机时,从不同角度拍摄的两张图像中物体位置的移动较小;而当物体远离相机时,物体位置的移动较大。这就是立体对应的概念,我们利用这一知识从给定场景中提取深度信息。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值