FINN（二）CNN，BNN及其硬件实现的背景知识

原创

已于 2024-07-04 11:12:14 修改 · 3.9k 阅读

·

3

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

于 2018-11-11 22:01:08 首次发布

本文介绍了卷积神经网络（CNN）的基本原理，如全连接层、2D卷积层和常见的CNN拓扑结构。此外，探讨了二值神经网络（BNN）的优势，包括减少参数冗余和提高硬件效率。最后，概述了神经网络在FPGA和ASIC上的硬件实现策略，如收缩阵列、流式架构、矢量处理器和神经突触处理器，并讨论了BNN在FPGA映射的潜力。

2.1 CNN

这项工作的重点是监督学习，其目标是找到一个函数g（x_i），它近似于映射x_i→y_i ∀i，其中{x_i，y_i}是一个输入/输出对，称为训练样例。多层感知器是一种人工神经网络，其神经元在多层中排列，神经元将前一层的所有神经元的输出作为输入。在数学上，全连接网络的第l层中nth神经元的输出a_l，n计算如下：
在这里插入图片描述

其中w_l，n，s是 l^th层中s^th突触与n^th神经元的输入相连的的权重，b_l，n是偏置项，f_act是激活函数，S₁是连接到l^th层中每个神经元的突触数。

流行的激活函数包括：双曲正切函数，f_act（a）= tanh（a）; 和整流线性单位（ReLU），f_act（a）= max（0，a）。此外，我们只研究推理问题，假设认为参数w已经被学习了。

卷积神经网络（CNN）是多层感知器的变体，其中，前一层仅接收来自前一层的小接收场的输入。这种方法大大减少了所涉及的参数数量，但仍能找到局部特征（例如：边缘，角落）。

神经网络中的基本2D卷积层类似于全连接层，除了以下的不同外：
a）每个神经元接收的图像为输入，生成的图像作为其输出（而不是标量）;
b）每个突触学习一小部分（卷积窗口的大小）权重;
c）输出图像中的每个像素是由所有突触权重和相应图像之间的卷积的总和得到的。

l^th卷积层的输出，需要输入S_l个尺寸为R_l×C_l的图像，（r，c）位置上的像素、p_{l，n，r，c}，n^th图像输出计算如下：
在这里插入图片描述

其中J_l×K_l是卷积窗口的大小。2D卷积层可以减少到矩阵乘法，然后再进行是元素激活函数运算，在后面会对此进行更加详细的介绍。

CNN拓扑结构由几个常见的基元组成：卷积层，池化层和全连接层

最低0.47元/天解锁文章

评论 1

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。