CS231n-图像分类笔记

想成为配环境大佬

于 2025-01-24 10:30:26 发布

阅读量422

点赞数 5

分类专栏： CS231n笔记文章标签：分类笔记数据挖掘计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/jiang_wan_/article/details/145336160

版权

CS231n笔记专栏收录该内容

2 篇文章

订阅专栏

博主本身有机器学习基础，看视频觉得效率很低，而且听得云里雾里的，又由于是老师要求看CS231n，故看的中文译版的笔记，自己看完之后再精简记录一下学习到的东西。
这是中文笔记地址https://github.com/whyscience/CS231n-Note-Translation_CN

第一节讲的是关于图像分类的kNN算法

基本思想：

计算机是看不到图片的，只能看到图片是由一个个像素值组成，要判断两张图片是否相似，如下图所示，计算它们的L1距离，即对应的各个像素值(即把图片转化为向量了)相减取绝对值，然后再进行求和，L1越小，两张图片越相似
在这里插入图片描述

还有一种方法是计算L2距离，与L1唯一的区别是，图片的像素值相减后平方，然后求和开方

L1与L2比较：在面对两个向量之间的差异时，L2比L1更加不能容忍这些差异。(毕竟他开方了)

还讲了代码，略过

kNN

看笔记没看懂，又去上网搜了一下
https://zhuanlan.zhihu.com/p/25994179这篇非常通俗易懂

由基本思想可知，我们是看测试集的图片离训练集的图片哪个更近，越近的图片的标签就是测试集图片的标签
在这里插入图片描述

ps：引用的上面那篇链接里面的

当k=1时，就选取离测试集最近的一个点，那万一离他最近的一个点是不小心引入的噪声怎么办
在这里插入图片描述
故k太小不行
k太大的话近似于无穷，相当于把测试集所以图片都包括进来了，也不看距离近不近了，直接退化成哪个标签的图片数量多，测试集的图片标签就变成哪个了

如何选取k？

由上面分析可知，k太大太小都不行
把测试集的10%~20%作为验证集(类似于最后的那个测试集)来进行调优选k(超参数)
若测试集很小，那就用交叉验证的方式，即把测试集分为5份左右，循环取一份作为验证集，观察k=多少的时候结果最好，然后取平均
一定不能把测试集当做训练集！！

kNN算法的优劣

优点：简单易实现
缺点：测试要花费大量时间计算，因为每个测试图像需要和所有存储的训练图像进行比较 ，在像素低维的情况下表现良好，但是在实际的图像分类工作中，因为图像都是高维度数据（他们通常包含很多像素），而高维度向量之间的距离通常是反直觉的

如图所示是用tSNE做的可视化技术，越相邻表示L2距离越小，图片越相似
大致看这张图，可知，图片的排列是被背景主导而不是图片语义内容本身主导 比如，狗的图片可能和青蛙的图片非常接近，这是因为两张图片都是白色背景。这和我们期望识别图片中的内容(语义)背道而驰，需继续向前探索

想成为配环境大佬

博客等级

码龄2年

59
原创

346
点赞

235
收藏

148
粉丝

关注

私信

热门文章

分类专栏

算法 30篇
深度学习代码 5篇
论文 10篇
数据结构 8篇
CS231n笔记 2篇
写论文 1篇
linux 1篇
大模型
若依 1篇
编程基础 1篇

最新评论

能量模型EBM(通俗理解)
m0_55789953: 讲的什么啊?分类也不是直接输出标签啊，也是在所有可能的类别里面去索引概率最高的一类，和这里能量匹配同理，只是基于的规则不一样
S2GAE论文阅读
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
Bandana论文阅读
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
MaskGAE论文阅读
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
数据结构之并查集
优快云-Ada助手: 算法技能树或许可以帮到你：https://edu.youkuaiyun.com/skill/algorithm?utm_source=AI_act_algorithm

大家在看

最新文章

2025

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。