一、什么是计算机视觉?
作为人类,我们可以轻松地感知周围世界的三维结构。想想当你看着坐在你旁边桌子上的花瓶时,三维感知是多么生动。您可以通过在其表面上播放的微妙的光影图案来分辨每个花瓣的形状和半透明度,并毫不费力地将每朵花从场景的背景中分割出来(图1)。
看着相框的集体肖像,您可以轻松地计算和命名照片中的所有人,甚至猜测从他们的面部表情中了解他们的情绪(图2-a )。
计算机视觉是模拟人类视觉感知环境的科学,它涉及图像处理、机器学习和深度学习技术,解决3D形状和外观恢复问题。广泛应用包括 OCR、机器检测、自动驾驶等。该领域利用概率模型和机器学习算法解决逆问题,如立体匹配和光流估计。计算机视觉的历史从1970年代至今,经历了从早期的边缘检测到现代深度学习的演变,目前在消费级和工业级应用中扮演重要角色,如图像拼接、自动驾驶和3D建模等。
作为人类,我们可以轻松地感知周围世界的三维结构。想想当你看着坐在你旁边桌子上的花瓶时,三维感知是多么生动。您可以通过在其表面上播放的微妙的光影图案来分辨每个花瓣的形状和半透明度,并毫不费力地将每朵花从场景的背景中分割出来(图1)。
看着相框的集体肖像,您可以轻松地计算和命名照片中的所有人,甚至猜测从他们的面部表情中了解他们的情绪(图2-a )。
3523
3572

被折叠的 条评论
为什么被折叠?