斯坦福CS231n课程笔记（第一课）

最新推荐文章于 2023-03-09 19:24:40 发布

原创最新推荐文章于 2023-03-09 19:24:40 发布 · 320 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#斯坦福课程

笔记同时被 2 个专栏收录

50 篇文章

订阅专栏

计算机视觉

5 篇文章

订阅专栏

该博客源自斯坦福课程，介绍CV历史，包括生物视觉和机器视觉发展。提及相关数据集，如PASCAL、ImageNet。阐述图像分类、1998年数字识别的模型参数，还介绍了语义分割、姿态识别等应用领域，以及医学诊断、自动驾驶等应用场景。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

斯坦福课程

背景：YouTube每秒有5小时的视频被上传，需要正确分类。

CV历史：

生物视觉：5亿4千万年前，寒武纪时期物种大爆发，眼睛进化出来。

机器视觉：

17世纪文艺复兴时期，小孔成像相机出现。
50-60年代，Hubel和Wiesel研究猫的视觉系统，将物体由简单几何形状表示。
1999年，SIFT目标识别。
2005年，HOG直方图特征。

数据集：

PASCAL，2006-2012
ImageNet，2009-至今

1、图像分类

图像分类、目标检测、图像摘要生成。

分类模型：
在这里插入图片描述

2、1998年数字识别

在这里插入图片描述

输入图像：32×32
卷积核：5×5（也叫滤波器）
池化核：2×2，步长：2，类型：MAX
卷积训练参数量：6×(5×5+1)
全连接层：120×(5×5×16+1)=48120，84×(120+1)= 10164

在这里插入图片描述

6×(3×5×5+1)+6×(4×5×5+1)+3×(4×5×5+1)+1×(6×5×5+1)

3、应用领域

语义分割
姿态识别
3D重建
图像理解

应用：医学诊断、自动驾驶、机器人。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小吕同学吖 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。