1. 计算机视觉概述
研究理论和应用:
• 研究如何使机器“看”的科学
• 让计算机具有人类视觉的所有功能
• 让计算机从图像数据中,提取有用的信息并解释
• 重构人眼;重构视觉皮层;重构大脑剩余部分
模拟人类视觉的优越能力:
• 识别人、物体、场景
• 估计立体空间、距离
• 躲避障碍物进行导航
• 想象并描述故事
• 理解并讲解图片
弥补人类视觉的缺陷:
• 关注显著内容、容易忽略很多细节
• 不在乎、不擅长精细感知
• 容易受幻觉干扰
• 描述主观、模棱两可
• 不善于长时间稳定的执行同一个任务
• 当然,还有视觉障碍人士
计算机视觉一般使用感知设备(如摄像头)模拟人的眼睛,使用计算设备(如CPU/GPU/FPGA)模拟人的大脑,如下图所示。

高度复合学科:
• 工程
• 计算机科学
• 数学
• 心理学
• 生物学
• …

2个主要研究维度:
• 语义感知(semantic)
• 几何属性(Geometry)

感知上的本质差异:

人工智能目标: • 解决”像素值”与”语义”之间的鸿沟(Gap)

2. 研究挑战
| 挑战 | 举例 |
|---|---|
| 视角变化 | ![]() |
| 光照变化 | ![]() |
| 尺度变化 | ![]() |
| 形态变化 | ![]() |
| 背景混淆干扰 | ![]() |
| 遮挡 | ![]() |
| 类内物体的外观差异 | ![]() |
3. 内容简介
部分I:计算机视觉的基础
⋄ \diamond ⋄ 图像预处理
⋄ \diamond ⋄ 图像特征及描述
⋄ \diamond ⋄ 未有深度学习之前
部分II:深度学习的理论基础
⋄ \diamond ⋄ BP神经网络详解
⋄ \diamond ⋄ 深度学习基础
部分III:深度学习在计算机视觉中的应用
⋄ \diamond ⋄ 图像分类 ← \leftarrow ← 卷积神经网络CNN
⋄ \diamond ⋄ 图像检测 ← \leftarrow ←</








最低0.47元/天 解锁文章
601





