Task3 字符识别模型

本文介绍了卷积神经网络(CNN)的工作原理,它通过卷积层、池化层和全连接层逐级提取图像特征,用于智能分类和识别。在任务3中,使用预训练的Resnet18网络,保留其卷积层,调整平均池化层和全连接层,以适应字符识别任务。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

** 卷积神经网络 **

人类的视觉原理是从原始信号摄入开始(瞳孔摄入像素 Pixels),接着做初步处理(大脑皮层某些细胞发现边缘和方向),然后抽象(大脑判定,眼前的物体的形状,是圆形的),然后进一步抽象(大脑进一步判定该物体是只气球)。下面是人脑进行人脸识别的一个示例:
在这里插入图片描述对于不同的物体,人类视觉也是通过这样逐层分级,来进行认知的
在这里插入图片描述卷积神经网络的原理,就是通过卷积层简化数据,提取出图片最基本的信息特征,若干个的卷积核可以提取出图片中若干个的基础特征,再由这些基础特征确定更高级别的特征,这样经过若干层子网络,就能最终确定图片中最高级别的特征,从而达到智能分类或识别的作用。

** 卷积网络结构**
卷积网络基本结构由3部分构成,即:卷积层、池化层、全连接层。

卷积层通过卷积核的过滤,提取出图片中局部的特征,降低了数据量。

池化层进一步降低数据的维度,避免过拟合。

全连接层在卷积层和池化层提取的特征数据上进行最终的分类。
一个网络往往是由多个卷积层和多个池化层构成的。

本任务中的网络

本任务保留了Resnet18卷积网络的卷积层,置换了平均池化层和最后的全连接层&

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值