超详细斯坦福CS231n课程笔记(第二课)——图像分类

本文深入探讨图像分类这一计算机视觉核心任务,从最近邻算法到线性分类,解析图像处理难点及解决方案,阐述评分函数与损失函数在优化过程中的关键作用。

图像分类

1. 概述

关于图像分类的任务,这是一个计算机视觉中真正核心的任务,准确来说,就是我们怎么研究图像处理的任务

更具体的说,当你做图像分类时,分类系统接收一些输入图像,比如说可爱的猫咪,并且系统已经清楚了一些已经确定了分类或者标签的集合,并且这些标签可能是 一只狗狗或者一只猫咪,也有可能是一辆卡车,那计算机的工作就是看图片,并且给它分配其中一些固定的分类或标签。

这听起来是一个很简单的问题,因为大家大脑里的视觉系统,天生就是来做这些视觉识别任务,但是对于机器来说,这是一个非常非常困难的问题。

当一个计算机看着这些图片的时候,它看到的是什么,计算机呈现图片的方式其实就是一大堆数字

 

你可以用很微小,很微妙的方式改变图片,这将导致像素网格整个发生变化,但是它还是一只猫,同时我们的算法需要对这些变化鲁棒

 

但是,不仅仅只有视角问题,还有照明问题,在场景中会有不同的照明条件,无论猫咪出现在这样的漆黑、昏暗的场景中,还是像这样非常明亮、阳光照射的场景中,它始终都是一只猫

 

目标可变,猫咪可以有千奇百怪的姿势和位置,对于不同的形变情形,我们的算法也应该是鲁棒的

 

当然可能也有遮挡的问题,不如你可能仅看到猫咪的一部分,但是作为一个人,在上述情况中,你非常容易去意识到这可能是一只猫咪,你还依然把这些图像看作猫咪,但是我们的算法依然要对这种情况作出鲁棒,这是一件非常难的事情

 

2. 最近邻算法

</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值