1、计算机视觉:挑战、进展与概率基础

计算机视觉:挑战、进展与概率基础

1. 计算机视觉的目标与挑战

计算机视觉旨在从图像中提取有用信息,但这是一项极具挑战性的任务。过去四十年来,众多聪明且富有创造力的人投身其中,然而,我们距离构建通用的“视觉机器”仍有很长的路要走。

视觉数据的复杂性是问题的一部分。以一个包含众多物体的视觉场景为例,几乎所有物体都部分被遮挡,且物体姿态各异,计算机视觉算法很难确定一个物体的结束和另一个物体的开始。比如,天空与背景中白色建筑的边界处,图像亮度几乎没有变化;而前景中SUV后车窗处,虽有明显的亮度变化,但并非物体边界或材质变化所致。

不过,我们自身的视觉系统能够轻松处理复杂图像,这证明了视觉是可行的。例如,我们能轻易数出图像中的树木数量、勾勒街道布局,甚至通过提取人物种族、汽车和树木类型、天气等细微视觉线索,在世界地图上确定照片拍摄的位置。

计算机视觉虽具挑战性,但并非不可能。我们在观察场景时,大脑已经对视觉信息进行了高度处理。例如,在明亮阳光下观察一块煤,然后移至昏暗室内观察一张白纸,眼睛从煤上接收到的单位面积光子数远多于白纸,但我们仍会将煤视为黑色,白纸视为白色。而在构建视觉算法时,我们无法借助这种预处理。

2. 计算机视觉的进展

近年来,计算机视觉取得了显著进展。过去十年,消费级计算机视觉技术首次大规模应用。例如,如今大多数数码相机都嵌入了人脸检测算法,微软Kinect(可实时跟踪人体的外设)更是创下了有史以来最畅销消费电子设备的吉尼斯世界纪录。

计算机视觉快速发展的原因主要有两个:
- 计算机性能提升 :计算机的处理能力、内存和存储容量大幅增加。早期计

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值