第二篇博客,讲讲图像识别中的多列深度神经网络(MCDNN)

本文探讨2012年CVPR上的MCDNN论文,该技术在手写体和交通标志识别上达到人类水平。通过多列深度神经网络,结合预处理和winner-take-all策略,实现高效训练。实验表明,不同预处理和多个DNN的组合能提高识别准确性,但增加DNN数量并未显著提升效果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

写博客有一点好,可以自己把脑子里的思路捋捋清,当初看过一篇将可视化神经网络的, 看了个半吊子,就给别人讲,结果大半都是忽悠过去,后面再研究研究,发现跟别人讲的很多都是错的,误导了吃瓜群众,这个心里是非常的过意不去了。这次写个博客,把思路先在脑子里捋一捋,再写出来,可以加深对论文的理解。

这里我非常粗浅的看了一下论文,就来写博客,肯定有些不对的地方,我自己做个笔记,如果有错误,希望大家不吝指出,我会及时做出修改,希望不要误导别的同学学习,十分感谢。

上篇文章立了个flag,说自己要讲讲这篇Multi-column Deep Neural Networks for Image Classification

我这边参考了:https://blog.youkuaiyun.com/u010529217/article/details/38701703

摘要

文章是2012年CVPR上的文章,现在有1772的引用,算是牛逼闪闪的论文了。

论文提出的深度神经网络在手写体识别和交通标志识别上达到了人类识别的水准。文章采用了winner-take-all neurons这么一个策略,只有获胜的神经元才能被训练(这玩意原文中说的贼玄乎,但是我觉得好像就是max pooling)。针对同一批输入进行不同的预处理工作,用多个DNN分别进行训练。其中每一个DNN被称为一个column,这就是文章中多列的意思,其实是指多个DNN,针对多个预测结果采用average的方法,获得最后的输出,因为利用了GPU,所以训练速度加快了很多(当年GPU训练还提出没多久)。

结构

(1)作者吹了一波相比别的小型的神经网络结构

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值