CNN张量输入形状和特征图
这个是比较容易理解的张量的解释,比较直观
卷积神经网络
在这个神经网络编程系列中,我们正在逐步构建一个卷积神经网络(CNN),所以让我们看看CNN的张量输入。
在最后两篇文章中,我们介绍了张量和基本的张量属性秩、轴和形状。如果你还没有看过那些文章,我强烈建议你去查看。
我现在想做的是,用一个实际的例子来应用秩、轴和形状的概念。为此,我们将考虑将图像输入作为CNN的张量。
卷积神经网络是图像识别任务的首选网络,因为它们非常适合检测空间模式。
记住,张量的形状编码了关于张量轴、秩和索引的所有相关信息,所以我们将在示例中考虑形状,这将使我们能够计算出其他值。让我们开始。
CNN输入的形状
CNN输入的形状通常有四个长度。这意味着我们有一个秩为4的张量,有四个轴。张量形状中的每个索引代表一个特定的轴,每个索引处的值给出了相应轴的长度。
张量的每个轴通常代表输入数据的某种现实世界或逻辑特征。如果我们理解这些特征及其在张量中的轴位置,那么我们就可以很好地理解张量数据结构的整体。
为了分解这一点,我们将从右到左反向工作,考虑轴。记住,我们