
图像分类
文章平均质量分 97
记录图像分类学习过程,分享有关知识,感谢交流学习
小酒馆燃着灯
我有一只快乐的小狗
展开
-
图像分类(二) 全面解读复现ZFNet
1.1 为什么起名ZFnetwork ILSVRC 2013获胜者是来自Matthew Zeiler和Rob Fergus的卷积网络。它被称为ZFNet(Zeiler&Fergus Net的简称)。这是对AlexNet的改进,通过调整架构超参数,特别是通过扩展中间卷积层的大小。 ZFNet是用人的名字命名的,那他到底出自哪篇论文呢?它出自Matthew D.Zeiler 和 Rob Fergus (纽约大学)2013年撰写的论文: 《》,转讲解“卷积神经网络的理解和可视化”原创 2023-11-18 20:24:48 · 300 阅读 · 0 评论 -
图像分类(七) 全面解读复现ShuffleNetV1-V2
我们介绍了一种名为ShuffleNet的计算效率极高的CNN架构,该架构是专为计算能力非常有限(例如10-150 MFLOP)的移动设备设计的。新架构利用了两个新的操作,逐点组卷积和通道混洗,可以在保持准确性的同时大大降低计算成本。ImageNet分类和MS COCO对象检测的实验证明了ShuffleNet优于其他结构的性能,例如在40个MFLOP的计算预算下,比最近的MobileNet [12]在ImageNet分类任务上的top-1错误要低(绝对7.8%)。翻译 2023-11-19 17:10:49 · 495 阅读 · 0 评论 -
图像分类(六) 全面解读复现MobileNetV1-V3
MobileNetV1前言MobileNetV1网络是谷歌团队在2017年提出的,专注于移动端和嵌入设备的轻量级CNN网络,相比于传统的神经网络,在准确率小幅度降低的前提下大大减少模型的参数与运算量。相比于VGG16准确率减少0.9%,但模型的参数只有VGG1/32。其实简单来说,就是把VGG中的标准卷积层换成深度可分离卷积。不过这个深度可分离卷积刚开始接触比较抽象难理解,建议大家看看文末链接里大佬的讲解视频噢!也欢迎大家在评论区讨论 (ฅ´ω`ฅ)~学习资料:论文题目:《MobileNets原创 2023-11-19 16:52:16 · 986 阅读 · 0 评论 -
图像分类(五) 全面解读复现ResNet
深度卷积神经网络在图像分类领域取得了一系列的突破。深度网络很好的将一个端到端的多层模型中的低/中/高级特征以及分类器整合起来,特征的等级可以通过所堆叠层的数量(深度)来丰富。最近有结果显示,模型的深度发挥着至关重要的作用,这样导致了ImageNet竞赛的参赛模型都趋向于“非常深”——16 层 到30层。许多其它的视觉识别任务的都得益于非常深的模型。在深度的重要性的驱使下,出现了一个新的问题:训练一个更好的网络是否和堆叠更多的层一样简单呢?原创 2023-11-19 16:09:02 · 640 阅读 · 0 评论 -
图像分类(四) 全面解读复现GoogleNet_InceptionV1-V4
摘要提出了这篇论文的核心 inception,定义为一个特殊网络的代号。并说了一下主要特点是提高了网络内部计算资源的利用率,在增加了网络的深度和宽度的情况下使网络计算资源不变(或减少)。GoogLeNet 是作者在 2014年ILSVRC 提交中应用的一个特例。GoogLeNet 网络深度达到22层,加上池化有27层,算上inception内部 有100层。虽然层数比VGG多了很多,但是参数量却变少了, GoogLeNet 500万个(5M),VGG16参数是138M,AlexNet参数大约60M。原创 2023-11-19 14:28:53 · 841 阅读 · 0 评论 -
图像分类(三) 全面解读复现VGGNet
在这项工作中,我们研究了卷积网络深度在大规模图像识别环境下对其精度的影响。我们的主要贡献是使用具有非常小(3×3)卷积滤波器的体系结构对增加深度的网络进行了彻底的评估,这表明通过将深度推进到16-19个权重层,可以实现对现有技术配置的显著改进。这些发现是我们2014年ImageNet挑战赛提交的基础,我们的团队在局部化和分类路径上分别获得了第一和第二名。我们还表明,我们的表示法很好地推广到了其他数据集,在这些数据集上,它们获得了最先进的结果。原创 2023-11-17 16:04:43 · 320 阅读 · 0 评论 -
图像分类(一) 全面解读复现AlexNet
我们训练了一个庞大的深层卷积神经网络,将ImageNet LSVRC-2010比赛中的120万张高分辨率图像分为1000个不同的类别。在测试数据上,我们取得了37.5%和17.0%的前1和前5的错误率,这比以前的先进水平要好得多。具有6000万个参数和650,000个神经元的神经网络由五个卷积层组成,其中一些随后是最大池化层,三个全连接层以及最后的1000个softmax输出。为了加快训练速度,我们使用非饱和神经元和能高效进行卷积运算的GPU实现。原创 2023-11-17 15:33:48 · 318 阅读 · 0 评论