一、计算机视觉基础
1. 定义
计算机视觉是一门让计算机学会“看”的学科, 研究如何自动理解图像和视频中的内容。
2. 任务
计算机视觉任务主要包括图像分类、图像检测和图像分割,其中单目标任务包括图像分类和图像定位,多目标任务包括目标检测和图像分割。
3. 发展
a. 早期萌芽
b. 统计机器学习与模式识别
c. 数据驱动的视觉系统
d. 深度学习时代
e. 大模型时代
4. 应用
计算机视觉的应用包括人脸识别、无人驾驶、风格迁移以及视频理解与自动剪辑等场景。
a. 人脸识别
b. 无人驾驶
c. 风格迁移
d. 视频理解与自动剪辑
二、OpenMMLab入门
1. 总体架构
2. 算法框架
a. 图像分类
b. 图像检测
c. 图像分割
d. 位姿估计
e. 目标跟踪
f. 行为识别
g. 文字识别
h. 图像编辑
3. 社区生态