一、常见的CV任务与区别
- 图像分类:图像层面,最基础的任务,常作为目标检测、图像分割任务的BackBone提取图像特征
- 目标检测:像素粒度(细粒度),对图像中的目标物体进行框选检测,分通用目标检测与特定目标检测两方面,人脸识别属于特定目标检测,识别世界中大千万物属于通用目标检测
- 语义分割:像素粒度,对图像中的单类或多类物体进行分割,仅可按照类别进行区分,同类物体具有相同的像素值
- 实例分割:像素粒度,对图像中的单个或多个物体进行分割,不同于语义分割,实例分割可分割出同类中的不同物体,每个物体具有单独的像素值以供区分
二、计算机视觉的发展之路
- 早期萌芽阶段:以Robert算子为代表的边缘检测算法提出,为计算机视觉的发展做出了不可磨灭的贡献
- 机器学习阶段:将机器学习技术应用到计算机视觉领域,EigenFace和Adaboost等机器学习方法开始将人脸识别领域推向实用化。
- 特征工程阶段:传统任务中,研究者常常针对实际场景进行特征工程,手动设计底层特征进行CV任务,不同的目标对象具备不同的滤波器提取特征,泛用性极差。
- 数据驱动:2006年,李飞飞教授启动了ImageNet数据库项目,机器可以通过学习大量数据,去自主学习出图像特征。无需手动构造。
- 视觉系统:2010年NEC-UIUC集合了层次结构、边缘检测以及机器学习方法,构建出一个完整的视觉分类系统,但仍未摆脱手动构造特征
- 深度学习