计算机视觉中的深度学习2: 图片分类

本文探讨了计算机视觉中图片分类的挑战,包括视角变化、图片交叉和背景干扰。介绍了Nearest Neighbor和K Nearest Neighbor算法,讨论了不同距离计算方式对结果的影响。同时,强调了超参数的重要性,并提出结合ConvNet的Nearest Neighbor方法能提高分类效果。图片分类作为计算机视觉基础,对于处理遮挡、变形等问题至关重要。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

计算机视觉中的深度学习2: 图片分类

Slides:百度云 提取码: gs3n

计算机与人眼的区别

对于一张灰度图片,计算机能看到的是像素大小的0~255的灰度值;对于RGB图片,则是一张像素大小的3通道矩阵,即800x600x3。

计算机视觉的挑战

  1. 视角变化的挑战
    1. 视角的变化带来的像素的变化是非常巨大的。
    2. 在不同的角度拍摄一只猫,人类很容易分辨这是同一种猫,而像素的变化却非常巨大,只有设计出了更加完备的算法才能让计算机程序更稳定地运行。
  2. 图片交叉的挑战
    1. 多只猫会重叠在一起。
  3. 粒度更细的分类
    1. 我们不仅仅需要分辨这是猫,我们还要分辨这是哪一个品种的猫。
  4. 杂乱的背景的影响
  5. 光线的变化
  6. 形状的变化

图片分类的作用

  1. 用在别的计算机视觉应用中
    1. Object detection
    2. Image captioning

图片分类的算法

  1. 传统计算机视觉算法
    1. 检测边缘,检测夹角等等
    2. 缺点:不够通用,当我们输入了一个非常复杂的算法能够识别猫了,同样的算法没法解决一个识别狗的问题。
  2. 机器学习方法
    1. 依赖数据源和分
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值