最近接到一个任务:用AI审核视频,帮助发现视频中的问题,提高运营审核的生产力。
这应该属于计算机视觉(Computer Vision)的领域。
计算机视觉的主要目标是:复刻人类视觉的强大能力。
计算机视觉要解决的主要问题是:给出一张图片,计算机视觉系统必须识别出图像中的对象及其特征,如形状、纹理、颜色、大小、空间排列等,从而尽可能完整地描述该图像。
计算机视觉,跟图像处理、机器视觉是什么区分的呢?
图像处理
图像处理旨在处理原始图像以应用某种变换。其目标通常是改进图像或将其作为某项特定任务的输入,而计算机视觉的目标是描述和解释图像。例如,降噪、对比度或旋转操作这些典型的图像处理组件可以在像素层面执行,无需对图像整体具备全面的了解。
机器视觉
机器视觉是计算机视觉用于执行某些(生产线)动作的特例。在化工行业中,机器视觉系统可以检查生产线上的容器(是否干净、空置、无损)或检查成品是否恰当封装,从而帮助产品制造。
计算机视觉
计算机视觉可以解决更复杂的问题,如人脸识别、详细的图像分析(可帮助实现视觉搜索,如 Google Images),或者生物识别方法。
计算机视觉的常见任务有:
图像分类,目标检测,实例分割,如下图(分别对应classification、detection、segmentation)