通俗易懂的卷积神经网络教程-第三讲

最新推荐文章于 2025-04-22 19:34:23 发布

原创最新推荐文章于 2025-04-22 19:34:23 发布 · 1.4k 阅读

·

3

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

深度学习同时被 2 个专栏收录

8 篇文章

订阅专栏

通俗易懂的卷积神经网络教程

7 篇文章

订阅专栏

通俗易懂的卷积神经网络教程-第三讲

我们复习一下上一节的内容，我们把一张28*28*1图片矩阵通过2次卷积，两次池化过程给它变成了4*4*12的矩阵。

之后呢，我们就要直接用BP神经网络进行全连接。用什么输入变量进行全连接呢？首先我们把这12个4*4的矩阵的其中第一个（PP1）给展开为一条，一共4*4=16个变量：

1

2

...

16

接着我们把第二个、第三个...一直到第12个矩阵（PP2~PP12）全部给同理展开成为一条，然后我们把所有的行变量合并成一个矩阵：

PP1	1	2	...	16
PP2	1	2	...	16
...	...	...	...	...
PP12	1	2	...	16

这样我们就得到了一个12*16=192的矩阵，接下来我们把第二行拼接到第一行末尾，第三行拼接到第二行末尾，以此类推，第12行拼接到71行末尾得到一个1*192的数组：

1

2

...

192

这样我们放入到BP全连接的输入变量就搞定了，那么怎么进行全连接呢？

（1）根据BP网络的内容我们知道，我们需要输出的结果是和标签变量一样的东西，标签变量是啥来着？我们复习一下：

如果是数字图片，标签中一共因变量Y共有十个值：如果图片中的数字是0，那么第一个格子中就是1，其余的就是0，可以写成：

1

0

0

0

0

0

0

0

0

0

是其他数字的话这张图最后的形式就是：

标签

Y1

Y2

Y3

Y4

Y5

Y6

Y7

Y8

Y9

Y10

其中Y1~Y10是0或者1的数字，如果图片中的数字是X，那么第X+1的位置就是1，其余位置就是0。

（2）我们输出的结果是和标签一样，那么输出的东西就是10个因变量Y，我们一共有输入变量192个，而输出变量是10个，如果把这些小球画出来就是这样的：

（3）这些小球用线连接了起来，那么线一共多少个呢，一个黄色小球对应10个橙色，那么192个黄色小球对应了10*192=1920个线条。有1920个线条就有1920个权值。于是我们生成1920个随机数，作为权值w，我们把第一个输入变量小球对应第一个输出变量小球的权值叫做w1,1，以此类推，把第i个输入变量小球对应第j个输出变量小球的权值叫做wi,j。

（4）我们有权值，还需要一个参数叫做偏置量b，这个需要多少个？输出变量有多少个，就有多少个b，我们这里面有10个，那么就随机生成10个偏置量。我们把第i个输出变量小球对应的偏置量叫做bi。

（5）我们生成权值和偏置量之后，我们用第一个黄色的小球的值与w1,1相乘，然后用第二个小球与w2,1相乘，以此类推第192个小球与w192,1相乘，我们得到了192个值，然后我们把这些值相加，之后再加一个b1，我们就得出了Y1值，也就是第一个橙色输出变量小球的值。

（6）我们用第1个黄色的小球的值与w1,2相乘，然后用第二个小球与w2,2相乘，以此类推第192个小球与w192,2相乘，我们得到了192个值，然后我们把这些值相加，之后再加一个b2，我们就得出了Y2值，也就是第一个橙色输出变量小球的值。

（7）同理求出Y3~Y10。这样我们就得出了10个橙色小球，也就是输出变量值。

（8）但是这样还没有完事儿，我们不能够光输出这样的值，我们应该给Y1~Y10扣上一个sigmoid函数，给它搞到0~1之间的一个数。这个函数这么写：

这两个公式就可以把Yj全部都给算出来，算出来之后，我们就得到了一个1*10的数组：

y1

y2

...

Y10

比如这个数组的值是：

0.00

0.01

0.01

0.04

0.04

0.05

0.01

0.01

0.01

0.00

我们得到数组之后，我们要做的是什么呢？计算一个目标函数，这个目标函数。这个目标函数应该如何计算我接下来再说。

为什么接下来再说，你们想想，我们上面计算了只是一张28*28的图片，而我们一共输入了6W张图片啊，我们是不是应该也按照上面，也就是从第一节开始到现在的方法把其它的图片都导入进去求Y值呀。但是其它图片太多了，共59999个，我们导入不了怎么办？

于是我们引入另外一个机制，叫做：数据块大小batchsize。我们根据batchsize的值，仅仅导入两位数的图片就好啦。比如我们设定batchsize为50，我们6W张图片的话，就用60000/50=1200组，我们分成1200组分别导入，也就是进行1200次卷积计算，每一组一共导入50张图片。

我们假定先进行第一组训练，我们随机选择50张图片，把其图片以及标签导入进入，然后通过上面的算法把输出的十个变量Y1~Y10都算出来，一共算了50组这样的数据，然后我们把这些Y1~Y10与它们应该一一对应的标签进行相减，然后平方后，相加，比如第一张图的输出值是：

0.00

0.01

0.01

0.04

0.04

0.05

0.01

0.01

0.01

0.00

它的标签是：

1

0

0

0

0

0

0

0

0

0

那么我们把它们的对应位置相减：

输出	0.00	0.01	0.01	0.04	0.04	0.05	0.01	0.01	0.01	0.00
标签	1	0	0	0	0	0	0	0	0	0
相减	-1	0.01	0.01	0.04	0.04	0.05	0.01	0.01	0.01	0

相减之后，我们再把相减的值给平方了：

相减	-1	0.01	0.01	0.04	0.04	0.05	0.01	0.01	0.01	0
平方	1	0.0001	0.0001	0.0016	0.0016	0.0025	0.0001	0.0001	0.0001	0

之后，我们再把平方后的数据加和为1.0062。

这样我们第一张图就算好了，同理我们算第二、第三。。。一直到第50张图，我们会得到50个结果，我们把这50个结果加和，然后除以50，得到了一个平均值，这个值用术语就叫做MSE平均方差。

我们把第一组batchsize的50个数据求完了，这样，第一次正向传播就结束了。我们今天就讲到这里，下节课再见！

下节课我们讲解反向传播。

————————————————

如果对我的课程感兴趣的话，欢迎关注小木希望学园-微信公众号：

mutianwei521

也可以扫描二维码哦！

小木希望学园

博客等级

码龄12年

75
原创

715
点赞

1747
收藏

1379
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 通俗易懂的卷积神经网络教程-第二讲

下一篇：: 通俗易懂的卷积神经网络教程-第四讲

最新评论

学东西要精不要杂
weixin_44593972: ---------说的太好了，我真的是反正25或者说23岁大学时候以前的时候真的是什么都想学，给排水专业对电子技术和计算机特别感兴趣，但是学的好少，现在27了还是想去学物联网，数字电路模拟电路这些，但是又担心人家大学开始到我这个年龄都学七八年了，实际干模电的话，也至少四五年真实经验。现在只能说把给排水某方面做的特别好，但是还是感觉必须学自动化和物联网这块，尴尬啊，因为想搞智慧水务，之前的干给排水现场施工监理的工作完全没兴趣，唯一有兴趣的就是工作后学点数学物理模电等的入门知识。 ------------感觉这辈子最感兴趣的技术方面就是物联网的模拟电路和数字电路，对于精小的密密麻麻的的集成电路，小时候看着那些家里电视机里的电路板就直接被完全吸引了，大学选不上那些专业。现在还是看着就让我有奋斗的动力，做现场施工的给排水，直接让我郁闷几年，觉得人生无望的感觉。 ------------其次感兴趣的流体力学之类，就是想像钱学森那般流体力学、空气动力学领域做到极致，好佩服，学给排水可能就是这本管网工程和流体力学这两个书比较感兴趣了。密密麻麻的的管线和流体的分析，但是基础理论掌握的好少，才学点伯努利方程，以前真是完全不懂自己的兴趣如何结合起来，现在看到智慧水务这个，相对来说，知道怎么把兴趣点结合一些，对于生命的动力强了太多，干之前的工作真是完全感觉人生迷茫到底怎么才能有所成就，居然产生了怀疑。 -----------其次大学自学的python，比较感兴趣的计算机编程和算法，也算学了点东西，但是学的很基础。对于未来的ai时代，这个编程语言绝对是大利器，有时候就要把他多学学。 -----------------上次听的一个up主说有本书写着人总是要被一个东西给迷住，这样才有意义，好像大概是这么个意思，也特别赞同这句话。
WaterGems第一讲：水力模拟计算
2501_92562809: 现在有中文版的啦
白话文讲计算机视觉-第二讲-cameo类库
虾影: Traceback (most recent call last): File "D:\Users\21712\PycharmProjects\xiaomuopcv\cameo.py", line 11, in <module> from manager import WindowManager, CaptureManager File "D:\Users\21712\PycharmProjects\xiaomuopcv\manager.py", line 15, in <module> class CaptureManager(object): File "D:\Users\21712\PycharmProjects\xiaomuopcv\manager.py", line 93, in CaptureManager if self._capture is not None: NameError: name 'self' is not defined
有限扩散集团凝聚模型第一讲： DLCA模型定义及MATLAB中的实现
cjx12321: 我也是，请问您解决了吗，开始和结束的图怎么出来呀
白话文讲计算机视觉-第三讲-滤波器
未照耀的荣光: 讲的太好了

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。