CS231n-2-Intro to Image Classifier

Victor的草原

于 2017-03-11 17:36:01 发布

阅读量535

点赞数

分类专栏： Computer Vision

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Victor__2015/article/details/61421709

版权

Computer Vision 专栏收录该内容

15 篇文章

订阅专栏

Image classification is the base of computer vision.

The main problem we meet is the semantic gap between pictures and pixels.
Moreover, there are so many variables such as brightness, deformation and background etc.

So what we should do is to build an image classifier robust to all changes.

Method - Data-driven approach - Machine Learning ( Dataset, Training, Test & Evaluation)

First classifier - Naive distance comparison

直接遍历训练集，比较测试图片与训练图片的像素差，最贴近的即为答案。
但这种方法也会有很多变数。如何定义距离？ distance metric

Manhattan : 对绝对值差求和
Euclidean : 欧式距离

关于选择哪个模型，这就是超参数(hyperparameter)。组会时也听到过。

事实上，这种方法 is never used. 因为它关于训练集是linear time，太慢了。我们要real-time test，通过 long-time training.

CNN入门 - Linear Classification

CNN负责CV，RNN负责NLP，结合完成机器对视觉图像的语义解读。

parametric approach 参数化方法

这里写图片描述

x为图像（我们把Pixel矩阵拉直成列向量），W为权重矩阵（调参的，足足30720个参数！），b为bias参数列向量。
最后得到的f(x,W)是个10维列向量，分别是对每个类别的打分（基于每个独立的分类器（W的行向量）对x的加权和）。
（理解上述简单的话，线性代数知识）

例子与高维空间的几何解释
这里写图片描述

本讲结束。下讲是Loss function，对分类器好坏的评判。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。