CS231n-2-Intro to Image Classifier

Image classification is the base of computer vision.

The main problem we meet is the semantic gap between pictures and pixels.
Moreover, there are so many variables such as brightness, deformation and background etc.

So what we should do is to build an image classifier robust to all changes.

Method - Data-driven approach - Machine Learning ( Dataset, Training, Test & Evaluation)

First classifier - Naive distance comparison

直接遍历训练集,比较测试图片与训练图片的像素差,最贴近的即为答案。
但这种方法也会有很多变数。如何定义距离? distance metric

  • Manhattan : 对绝对值差求和
  • Euclidean : 欧式距离
    这里写图片描述

关于选择哪个模型,这就是超参数(hyperparameter)。组会时也听到过。

事实上,这种方法 is never used. 因为它关于训练集是linear time,太慢了。我们要real-time test,通过 long-time training.

CNN入门 - Linear Classification

CNN负责CV,RNN负责NLP,结合完成机器对视觉图像的语义解读。

parametric approach 参数化方法

这里写图片描述

x为图像(我们把Pixel矩阵拉直成列向量),W为权重矩阵(调参的,足足30720个参数!),b为bias参数列向量。
最后得到的f(x,W)是个10维列向量,分别是对每个类别的打分(基于每个独立的分类器(W的行向量)对x的加权和)。
(理解上述简单的话,线性代数知识)

例子与高维空间的几何解释
这里写图片描述
这里写图片描述

本讲结束。下讲是Loss function,对分类器好坏的评判。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值