深度学习中的目标检测技术解析
1. 深度学习与端到端学习
深度学习实现了端到端学习的理念。在这种学习方式中,每个图像都包含经过对象类别标注的图像数据集,这些数据集仅呈现给机器。然后,基于给定的数据训练模型,神经网络会在每组图像中发现每个对象的潜在模式,并找出每个特定类型对象最具洞察力和显著性的特征。
2. 卷积神经网络(CNNs)
2.1 CNN的发展与优势
在计算机视觉(CV)领域,过去几年中卷积神经网络(CNNs)的发展产生了巨大影响,极大地改变了对象识别能力。这种进步得益于计算能力的提升以及用于神经网络训练的数据量的增加。
与自编码器(SAEs)和深度置信网络(DBNs)这类全连接网络不同,全连接网络在相邻层之间所有单元都相互连接,对于图像等某些类型的数据,需要学习大量参数。而CNN受动物视觉皮层组织的启发,采用权重共享技术,利用图像中不同位置的相似结构单元。这显著减少了需要训练的参数数量,并通过在整个图像中局部共享卷积权重,使网络在输入平移方面具有等效性。
2.2 CNN的基本架构
简单的CNN架构包含多个不同功能的层,如卷积层、池化层和全连接层,如下表所示:
| 层类型 | 功能 |
| ---- | ---- |
| 卷积层 | 利用内核(滤波器)检测给定图像中的特征或边缘。内核是一个包含值的矩阵,通过学习这些值来检测特定特征,这些值被称为权重。卷积过程通过计算内核与输入区域的点积,提供一个反映特定功能存在可能性的值,然后将卷积层的输出与偏置项相加,并输入到非线性激活函数中,以学习内核权重。常见的激活函数有双曲正切函数tanh、sigmoid函数和
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



