图像分类
1. 概述
关于图像分类的任务,这是一个计算机视觉中真正核心的任务,准确来说,就是我们怎么研究图像处理的任务
更具体的说,当你做图像分类时,分类系统接收一些输入图像,比如说可爱的猫咪,并且系统已经清楚了一些已经确定了分类或者标签的集合,并且这些标签可能是 一只狗狗或者一只猫咪,也有可能是一辆卡车,那计算机的工作就是看图片,并且给它分配其中一些固定的分类或标签。
这听起来是一个很简单的问题,因为大家大脑里的视觉系统,天生就是来做这些视觉识别任务,但是对于机器来说,这是一个非常非常困难的问题。
当一个计算机看着这些图片的时候,它看到的是什么,计算机呈现图片的方式其实就是一大堆数字

你可以用很微小,很微妙的方式改变图片,这将导致像素网格整个发生变化,但是它还是一只猫,同时我们的算法需要对这些变化鲁棒

但是,不仅仅只有视角问题,还有照明问题,在场景中会有不同的照明条件,无论猫咪出现在这样的漆黑、昏暗的场景中,还是像这样非常明亮、阳光照射的场景中,它始终都是一只猫

目标可变,猫咪可以有千奇百怪的姿势和位置,对于不同的形变情形,我们的算法也应该是鲁棒的

当然可能也有遮挡的问题,不如你可能仅看到猫咪的一部分,但是作为一个人,在上述情况中,你非常容易去意识到这可能是一只猫咪,你还依然把这些图像看作猫咪,但是我们的算法依然要对这种情况作出鲁棒,这是一件非常难的事情

2. 最近邻算法
</

本文深入探讨图像分类这一计算机视觉核心任务,从最近邻算法到线性分类,解析图像处理难点及解决方案,阐述评分函数与损失函数在优化过程中的关键作用。
最低0.47元/天 解锁文章
1078

被折叠的 条评论
为什么被折叠?



