计算机视觉(一)—— 基础介绍

1. 计算机视觉概述

  研究理论和应用:
    • 研究如何使机器“看”的科学
    • 让计算机具有人类视觉的所有功能
    • 让计算机从图像数据中,提取有用的信息并解释
    • 重构人眼;重构视觉皮层;重构大脑剩余部分

  模拟人类视觉的优越能力:
    • 识别人、物体、场景
    • 估计立体空间、距离
    • 躲避障碍物进行导航
    • 想象并描述故事
    • 理解并讲解图片

  弥补人类视觉的缺陷:
    • 关注显著内容、容易忽略很多细节
    • 不在乎、不擅长精细感知
    • 容易受幻觉干扰
    • 描述主观、模棱两可
    • 不善于长时间稳定的执行同一个任务
    • 当然,还有视觉障碍人士

  计算机视觉一般使用感知设备(如摄像头)模拟人的眼睛,使用计算设备(如CPU/GPU/FPGA)模拟人的大脑,如下图所示。

在这里插入图片描述

  高度复合学科:
    • 工程
    • 计算机科学
    • 数学
    • 心理学
    • 生物学
    • …
在这里插入图片描述
  2个主要研究维度:
    • 语义感知(semantic)
    • 几何属性(Geometry)

在这里插入图片描述
  感知上的本质差异:

在这里插入图片描述

  人工智能目标: • 解决”像素值”与”语义”之间的鸿沟(Gap)

在这里插入图片描述

2. 研究挑战

挑战 举例
视角变化 在这里插入图片描述
光照变化 在这里插入图片描述
尺度变化 在这里插入图片描述
形态变化 在这里插入图片描述
背景混淆干扰 在这里插入图片描述
遮挡 在这里插入图片描述
类内物体的外观差异 在这里插入图片描述

3. 内容简介

  部分I:计算机视觉的基础
      ⋄ \diamond 图像预处理
      ⋄ \diamond 图像特征及描述
       ⋄ \diamond 未有深度学习之前
  部分II:深度学习的理论基础
      ⋄ \diamond BP神经网络详解
      ⋄ \diamond 深度学习基础
  部分III:深度学习在计算机视觉中的应用
      ⋄ \diamond 图像分类 ← \leftarrow 卷积神经网络CNN
      ⋄ \diamond 图像检测 ← \leftarrow </

评论 21
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值