一、计算机视觉基础
1. 定义
计算机视觉是一门让计算机学会“看”的学科, 研究如何自动理解图像和视频中的内容。

2. 任务
计算机视觉任务主要包括图像分类、图像检测和图像分割,其中单目标任务包括图像分类和图像定位,多目标任务包括目标检测和图像分割。

3. 发展
a. 早期萌芽

b. 统计机器学习与模式识别

c. 数据驱动的视觉系统

d. 深度学习时代


e. 大模型时代

4. 应用
计算机视觉的应用包括人脸识别、无人驾驶、风格迁移以及视频理解与自动剪辑等场景。
a. 人脸识别

b. 无人驾驶

c. 风格迁移
d. 视频理解与自动剪辑

二、OpenMMLab入门

1. 总体架构


2. 算法框架
a. 图像分类

b. 图像检测

c. 图像分割

d. 位姿估计

e. 目标跟踪

f. 行为识别

g. 文字识别

h. 图像编辑

3. 社区生态



文章介绍了计算机视觉的基本概念、发展历史及主要应用,如人脸识别和无人驾驶。此外,还详细讨论了OpenMMLab框架,涵盖了从图像分类到行为识别等多个领域的算法。
2390

被折叠的 条评论
为什么被折叠?



