图像与序列:卷积神经网络与循环神经网络解析
在数据处理领域,不同类型的数据具有不同的特性。图像具有空间维度,语音具有时间维度,而文本则是一系列可能存在长期依赖关系的无界符号序列。随着时间的推移,研究人员已经探索出如何设计神经网络来处理空间、时间和序列数据。下面将深入探讨卷积神经网络(CNN)和循环神经网络(RNN)的相关知识。
1. 卷积神经网络(CNN)
宇宙中物体具有强烈的层次结构,较小的部分组合形成更复杂的结构。卷积神经网络(CNN)作为计算机视觉应用的主流模型,其设计基于这种部分 - 整体的层次结构,有两个主要的设计动机。
1.1 视觉皮层的生物学原理
CNN的第一个设计动机源于生物学。20世纪50 - 60年代,David Hubel和Torsten Wiesel在哈佛大学对哺乳动物的视觉神经科学进行了研究。他们通过对猫的实验,将神经元分为两类:
- 简单细胞 :对特定空间位置上的定向线条等特定图像特征做出响应。
- 复杂细胞 :以空间不变的方式对相同的定向线条做出响应,即无论线条在图像中的空间位置如何,都会做出响应。
复杂细胞基于简单神经元的输出进行更高级的处理,使感官处理具有平移不变性。由于这一开创性的工作,Hubel和Wiesel在1981年获得了生理学和医学诺贝尔奖。
1.2 模式匹配
CNN的第二个设计动机来自信号和图像处理领域。在信号和图像处理中,卷积是一种以滑动窗口方式进行的乘法和加法运算。在线性代数中,这种乘法和加法运算被称为点积或内积。点积用于衡量两个向量之间的匹配强度,
CNN与RNN:图像与序列处理解析
超级会员免费看
订阅专栏 解锁全文
6万+

被折叠的 条评论
为什么被折叠?



