深度学习在图像识别与信号处理中的应用与优化
图像识别中的深度学习模型
在图像识别领域,人工神经网络已广泛应用于记录的研究和识别。为了识别孤立的手写和打印字符,人们进行了许多尝试并取得了公认的成果。在实际应用中,使用了完整的神经网络模型,为了最小化图像的总体积或将图像缩放到不同分辨率,在分析中不使用批量归一化和全连接层。
原始网络经过常规变换后的层参数为 104,976 个单精度浮点数,这意味着大约有 1000 万次乘法和修改计算。每次乘加和其他 CPU 负载总共需要 5 - 15 个 STM 周期。
为了限制参数数量和计算量,对网络进行了如下规划:
1. 减小滤波器单元大小,增加池化层数量。
2. 减少输入帧数量。
3. 最小化内核复杂度。
以下是卷积网络的详细信息:
| Layer | Sizein | Sizeout | Kernel | param | FLOPS |
| — | — | — | — | — | — |
| Con1 | 1 28 28 | 16 28 28 | 16,1 3 3 | 144 | 113 K |
| Con2 | 16 28 28 | 16 28 28 | 16,16 3 3 | 2304 | 1.8 M |
| Poo1 | 16 28 28 | 16 14 14 | 2 2 | – | - |
| Con3 | 16 14 1
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



