
深度学习
frank909
爱阅读的程序员,专注于技术思考和分享。关注架构设计、Android 开发、AI、数学、自动驾驶领域,个人公号:Frankcall
展开
-
死嗑YOLO系列(三),YOLOv3风月无边
YOLOv2 的时候,作者在 YOLOv1 的基础上运用了许多有效的 tricks,所以展示了它的 better、faster、stronger 因素,到了 YOLOv3 的时候,这个模型仍然在进化,保持速度的同时,把准确率给提升了许多。速度始终是YOLO系列安身立命之本.这是极具挑衅的一张性能对比图。以实时性要求为分界,这世界上只有 2 种算法,YOLOv3 和其它。...原创 2020-12-05 23:37:49 · 1402 阅读 · 0 评论 -
非科班程序员AI学习路径建议
本文适用于有下面情况的同学们:对 AI 感兴趣非科班数学基础不好对算法抗拒研究生一下学历近几年,AI 很火,在很多领域都取得了突破性的成果。这吸引了很多人的目光,我从几年前决定投入到 AI 的怀抱中,过程很艰苦,走了很多弯路,希望此文能带给新人一些提示。数学问题很多同学担心自己数学底子薄,所以要不要入 AI 考虑了很久,还不敢下定决心。我也是本科毕业,大学荒废了数学。后来,...原创 2019-11-08 11:37:48 · 5019 阅读 · 11 评论 -
用Pytorch自建6层神经网络训练Fashion-MNIST数据集,测试准确率达到 92%
一般的深度学习入门例子是 MNIST 的训练和测试,几乎就算是深度学习领域的 HELLO WORLD 了,但是,有一个问题是,MNIST 太简单了,初学者闭着眼镜随便构造几层网络就可以将准确率提升到 90% 以上。但是,初学者这算入门了吗?答案是没有。现实开发当中的例子可没有这么简单,如果让初学者直接去上手 VOC 或者是 COCO 这样的数据集,很可能自己搭建的神经网络准确率不超过 30%。...原创 2019-09-10 15:32:01 · 16578 阅读 · 17 评论 -
【深度学习】目标检测中 IOU 的概念及计算
在目标检测当中,有一个重要的概念就是 IOU。一般指代模型预测的 bbox 和 Groud Truth 之间的交并比。何为交并比呢?IOU=A∩BA∪BIOU = \frac{A\cap B}{A\cup B}IOU=A∪BA∩B集合 A 和集合 B 的并集包括了上面 3 种颜色区域。集合 C 是集合 A 与集合 B 的交集。在目标检测当中,IOU 就是上面两种集合的比值。A∪...原创 2019-06-10 11:59:45 · 37614 阅读 · 7 评论 -
【深度学习】轻量级神经网络 SqueezeNet 讲解
在深度学习领域,人们一般把注意力集中在如何提高神经网络的准确度上,所以,神经网络的层次越来越深,参数也越来越多,但带来的问题就是神经网络对于硬件的要求越来越高,但在嵌入式硬件上比如手机、自动驾驶的计算平台,这将很吃力,所以,有一些人会将精力放在如何精简和优化网络模型上,以便它们能够比较顺利运行在硬件条件有限的嵌入式设备上面。而 SqueezeNet 就是一种精简化的轻量级的卷积神经网络结构。小...原创 2018-12-13 21:44:04 · 21810 阅读 · 1 评论 -
【深度学习】目标检测算法 YOLO 最耐心细致的讲解
YOLO 是 2016 年提出来的目标检测算法,在当时比较优秀的目标检测算法有 R-CNN、Fast R-CNN 等等,但 YOLO 算法还是让人感到很新奇与兴奋。YOLO 是 You only look once 几个单词的缩写,大意是你看一次就可以预测了,灵感就来自于我们人类自己,因为人看一张图片时,扫一眼就可以得知这张图片不同类型目标的位置。YOLO 胜在它的简单与快速。YOLO 是...原创 2018-12-04 20:43:50 · 26275 阅读 · 6 评论 -
【深度学习】Batch Normalizaton 的作用及理论基础详解
对于 Batch Normalization 的知识最原始的出处来源于《Batch Normalization:Accelerating Deep Network Trainning by Reducing Internal Covariate Shift》这篇论文。文章开始前,先讲一下 Batch Normalization 有什么好处。加速神经网络的训练过程。减少对 Dropout 的...原创 2018-11-18 16:11:48 · 13300 阅读 · 0 评论 -
用 PyTorch 从零创建 CIFAR-10 的图像分类器神经网络,并将测试准确率达到 85%
一般,深度学习的教材或者是视频,作者都会通过 MNIST 这个数据集,讲解深度学习的效果,但这个数据集太小了,而且是单色图片,随便弄些模型就可以取得比较好的结果,但如果我们不满足于此,想要训练一个神经网络来对彩色图像进行分类,可以不可以呢?当然可以的,但是没有想象的容易。我最开始亲自设置神经网络去训练时,训练准确度还不到 30%,并且不能收敛。后来逐步运用自己对于深度学习的理解去不断调整网络的...原创 2018-11-21 16:47:38 · 37338 阅读 · 39 评论 -
【深度学习】经典神经网络 VGG 论文解读
VGG 在深度学习领域中非常有名,很多人 fine-tune 的时候都是下载 VGG 的预训练过的权重模型,然后在次基础上进行迁移学习。VGG 是 ImageNet 2014 年目标定位竞赛的第一名,图像分类竞赛的第二名,需要注意的是,图像分类竞赛的第一名是大名鼎鼎的 GoogLeNet,那么为什么人们更愿意使用第二名的 VGG 呢?因为 VGG 够简单VGG 是 Visual Geometr...原创 2018-11-06 18:56:08 · 22459 阅读 · 0 评论 -
【深度学习】经典神经网络 ResNet 论文解读
ResNet 是何凯明团队的作品,对应的论文 《Deep Residual Learning for Image Recognition》是 2016 CVPR 最佳论文。ResNet 的 Res 也是 Residual 的缩写,它的用意在于基于残差学习,让神经网络能够越来越深,准确率越来越高。我们都知道,自 2012 年 AlexNet 在 ILSVRC 一战成名后,卷积神经网络便一发不可收拾...原创 2018-10-30 18:55:43 · 39334 阅读 · 0 评论 -
【Tensorflow】数据及模型的保存和恢复
如果你是一个深度学习的初学者,那么我相信你应该会跟着教材或者视频敲上那么一遍代码,搭建最简单的神经网络去完成针对 MNIST 数据库的数字识别任务。通常,随意构建 3 层神经网络就可以很快地完成任务,得到比较高的准确率。这时候,你信心大增,准备挑战更难的任务。你准备进行针对彩色图片做类型识别,那么选 CIFAR-10 就好了。于是,你也基于自己的理解,搭建了一个较为复杂的神经网络,于是,问题可能...原创 2018-10-23 22:56:41 · 12334 阅读 · 3 评论 -
【深度学习】CNN 中 1x1 卷积核的作用
最近研究 GoogLeNet 和 VGG 神经网络结构的时候,都看见了它们在某些层有采取 1x1 作为卷积核,起初的时候,对这个做法很是迷惑,这是因为之前接触过的教材的例子中最小的卷积核是 3x3 ,那么,1x1 的卷积核有什么意义呢?最初应用 1x1 卷积核的神经网络是 Network In Network,然后 GoogLeNet 和 VGG 也不约而同的更正了。他们在论文中解释,大概有下...原创 2018-10-19 18:12:18 · 17830 阅读 · 3 评论 -
【深度学习】多通道图像卷积过程及计算方式
之前,有写了一篇博文,【深度学习入门】——亲手实现图像卷积操作介绍卷积的相应知识,但那篇文章更多的是以滤波器的角度去讲解卷积。但实际上是神经网络中该博文内容并不适应。之前的文章为了便于演示,针对的是二维卷积,比如一张图片有 RGB 三个颜色通道,我的方式是每个通道单独卷积,然后将各个通道合成一张图片,再可视化出来。但真实工程不会是这样的,很多东西需要进一步说明白。熟悉 TensorFlow 的...原创 2018-10-15 21:42:50 · 57282 阅读 · 42 评论 -
【深度学习】R-CNN 论文解读及个人理解
背景本篇论文的题目是 《Rich feature hierarchies for accurate oject detection and semantic segmentation》,翻译过来就是针对高准确度的目标检测与语义分割的多特征层级,通俗地来讲就是一个用来做目标检测和语义分割的神经网络。本文作者:Ross Girshick,JeffDonahue,TrevorDarrell,Ji...原创 2018-08-24 10:04:15 · 221793 阅读 · 39 评论 -
【Tensorflow】Dataset 中的 Iterator
Tensorflow 现在将 Dataset 作为首选的数据读取手段,而 Iterator 是 Dataset 中最重要的概念。这篇文章的目的是,以官网文档为基础,较详细的介绍 Iterator 的用法。Dataset 和 Iterator 的关系在文章开始之前,首先得对 Dataset 和 Iterator 有一个感性的认识。Dataset 是数据集,Iterator 是对应的数据集...原创 2018-07-09 10:59:33 · 29930 阅读 · 12 评论 -
【Tensorflow】你可能无法回避的 TFRecord 文件格式详细讲解
如果你是 Tensorflow 的初学者,那么你或多或少在网络上别人的博客上见到过 TFRecord 的影子,但很多作者都没有很仔细地对它进行说明,这也许会让你感受到了苦恼。本文按照我自己的思路对此进行一番讲解,也许能够提供给你一些帮助。TFRecord 是什么?TFRecord 是谷歌推荐的一种二进制文件格式,它可以将任何信息按照特定的格式转换成二进制。TFRecord 的核心内容在...原创 2018-06-25 15:38:23 · 33628 阅读 · 29 评论 -
【Tensorflow】 写给初学者的深度学习教程之 MNIST 数字识别
一般而言,MNIST 数据集测试就是机器学习和深度学习当中的"Hello World"工程,几乎是所有的教程都会把它放在最开始的地方.这是因为,这个简单的工程包含了大致的机器学习流程,通过练习这个工程有助于读者加深理解机器学习或者是深度学习的大致流程.可恰恰就是在这个地方,却容易给初学者带来困扰.原因就是多数作者,对待这个比较容易的项目比较随意,经常就是把代码一张贴就完事了,读者会跟着代码敲一...原创 2018-05-24 19:54:10 · 29890 阅读 · 16 评论 -
【深度学习入门】——亲手实现图像卷积操作
深度学习中有一个很重要的概念就是卷积神经网络 CNN,卷积神经网络中又有卷积层、池化层的概念。尤其是卷积层,理解难度比较大,虽然书中或者是视频中都有详细介绍过它的基础概念,但对于求知欲望很强烈的我,我总心里痒痒的,总想亲手实现,看看效果,怕的就是自己会眼高手低,做技术人最可怕的就是眼高手低。所以,我打算用 python 来亲自验证一遍。什么是卷积?卷积(convolution)是数学知...原创 2018-03-22 16:46:22 · 26919 阅读 · 12 评论