计算机视觉概述

计算机视觉是一门科学,旨在赋予机器类似人类的视觉能力,包括识别物体、场景,估算空间和距离,同时弥补人类视觉的局限,如忽略细节、易受干扰等。该领域致力于解决像素到语义的转换难题,面对视角、光照、尺度等变化带来的挑战。其应用涵盖了图像分析、自动驾驶、障碍物避障等多个方面。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

计算机视觉概述

一、研究理论和应用:

  1. 研究如何使机器“看”的科学
  2. 让计算机具有人类视觉的所有功能
  3. 让计算机从图像数据中,提取有用的信息,并解释
  4. 重构人眼;重构视觉皮层;重构大脑剩余部分

二、模拟人类视觉的优越能力:

  1. 识别人、物体、场景
  2. 估计立体空间、距离
  3. 躲避障碍物进行导航
  4. 想象并描述故事
  5. 理解并讲解图片

三、弥补人类视觉的缺陷

  1. 关注显著内容、容易忽略很多细节
  2. 不在乎、不擅长精细感知
  3. 容易受幻觉干扰
  4. 描述主观、模棱两可
  5. 不善于长时间稳定的执行同一个任务
  6. 当然,还有视觉障碍人士

四、计算机视觉能做的事

在这里插入图片描述

五、人工智能目标

解决“像素值”与“语义”之间的鸿沟
在这里插入图片描述

六、研究挑战

1.视角变化
在这里插入图片描述

2.光照变化
在这里插入图片描述

3.尺度变化
在这里插入图片描述

4.形态变化
在这里插入图片描述

5.背景混淆干扰
在这里插入图片描述

6.遮挡
在这里插入图片描述

7.类内物体的外观差异
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值