计算机视觉:概念、历史与应用全解析
1. 计算机视觉概述
人类能轻松感知周围世界的三维结构,比如看到桌上的花瓶,能轻易分辨花瓣形状、透明度,还能将花朵与背景区分开。然而,计算机视觉研究者虽已取得诸多进展,如从大量重叠照片中重建环境的部分三维模型、进行立体匹配构建三维表面模型、跟踪复杂背景下的人物、识别照片中的人物等,但让计算机达到两岁小孩的图像理解水平,如数出图片中的动物数量,仍难以实现。
视觉之所以困难,是因为它是一个逆问题,在信息不足的情况下恢复未知量,需借助基于物理和概率的模型来消除潜在解决方案的歧义。计算机视觉的正向模型源于物理学(辐射测量学、光学和传感器设计)和计算机图形学,而计算机视觉则是逆向操作,描述图像中的世界并重建其属性。
计算机视觉在众多现实世界应用中得到广泛使用:
- 工业应用 :
- 光学字符识别(OCR) :读取信件上手写的邮政编码和自动识别车牌。
- 机器检查 :使用立体视觉和特殊照明对飞机机翼或汽车车身部件进行快速零件检查,或用X射线检测钢铸件的缺陷。
- 零售 :用于自动收银通道的物体识别。
- 3D模型构建(摄影测量) :从航空照片中全自动构建3D模型,用于Bing Maps等系统。
- 医学成像 :注册术前和术中图像,或对人们随着年龄增长的大脑形态进行长期研究。
- 汽车安全 :检测街道上的意外障碍物,如行人。 <
超级会员免费看
订阅专栏 解锁全文
8万+

被折叠的 条评论
为什么被折叠?



