计算机视觉:挑战、进展与知识体系
计算机视觉的挑战与可能
计算机视觉的目标是从图像中提取有用信息,但这是一项极具挑战性的任务。视觉数据的复杂性是主要难题之一。例如在一个包含众多物体的场景图像中,几乎所有物体都部分被遮挡,且物体很少以“典型”姿态呈现,计算机很难确定一个物体的结束和另一个物体的开始。像天空和背景中白色建筑的边界处,图像亮度几乎没有变化;而前景中SUV后窗处虽有明显亮度变化,但并非物体边界或材质变化导致。
不过,我们自身的视觉系统能轻松处理复杂图像,这证明了视觉的可行性。比如,我们能轻松数出图像中的树木数量、勾勒街道布局,甚至通过提取人物种族、汽车和树木类型、天气等细微视觉线索,在世界地图上确定照片拍摄地点。
计算机视觉虽有挑战,但并非不可能。我们在观察场景时,大脑已经对视觉信息进行了高度处理。例如,在强光下观察一块煤,再到昏暗室内看一张白纸,眼睛从煤接收到的单位面积光子数远多于白纸,但我们仍会认为煤是黑色,纸是白色。而在构建视觉算法时,我们无法利用这种预处理优势。
计算机视觉的进展与原因
近年来,计算机视觉取得了显著进展。过去十年,消费级计算机视觉技术首次大规模应用。如今,大多数数码相机都嵌入了人脸检测算法,微软Kinect作为能实时跟踪人体的外设,还创下了最快销售的消费电子设备吉尼斯世界纪录。
计算机视觉快速发展有几个原因:
1. 计算机性能提升 :计算机的处理能力、内存和存储容量大幅增加。早期计算机视觉先驱若要在内存中存储一张高分辨率图像,都需要专门的硬件。
2. 机器学习的广泛应用 :过去20年,机器学
超级会员免费看
订阅专栏 解锁全文
1334

被折叠的 条评论
为什么被折叠?



