深度学习入门
文章平均质量分 94
本专栏将系统性地讲述深度学习知识,目标是让 AI 基础的程序员能够快速入门,并且能够很好的理解一些枯燥的知识难点。
frank909
爱阅读的程序员,专注于技术思考和分享。关注架构设计、Android 开发、AI、数学、自动驾驶领域,个人公号:Frankcall
展开
-
自动驾驶激光点云 3D 目标检测 PointPillar 论文简述
之前有针对 VoxelNet 这篇论文做过简述,今天的主题是 PointPillar。PointPillar 是 2019 年提出来的模型,相比于之前的点云处理模型,它有 3 个要点:提出 Pillar 这个概念,将类 PointNets 模型能够以 Pillar 为基础单位学习点云特征运用标准化的 2D 卷积进行后续处理快,满足实时要求,最快的版本到达 105 HzPointPillar 和前辈处理点云最先需要大量的手工作业,后来 VoxelNet 第一次引入了真正的端到端的特征学习。但原创 2021-04-11 15:16:56 · 5466 阅读 · 2 评论 -
自动驾驶激光点云 3D 目标检测 VoxelNet 论文简述
自动驾驶感知视觉有 2 个流派,分别是摄像头视觉和激光雷达视觉,本文分析激光雷达视觉当中经典的算法模型 VoxelNet。论文:VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection这是 2017 年的论文出自苹果公司算法团队,这篇论文对于刚学习激光雷达目标检测的同学来讲非常有参考价值。图像和点云摄像头对环境进行测量,产生的一般是 RGB 格式图片,图片上的一个像素通常有 rgb 3 个颜色通道的数据。一般说图原创 2021-03-31 23:47:51 · 2142 阅读 · 1 评论 -
死嗑YOLO系列(三),YOLOv3风月无边
YOLOv2 的时候,作者在 YOLOv1 的基础上运用了许多有效的 tricks,所以展示了它的 better、faster、stronger 因素,到了 YOLOv3 的时候,这个模型仍然在进化,保持速度的同时,把准确率给提升了许多。速度始终是YOLO系列安身立命之本.这是极具挑衅的一张性能对比图。以实时性要求为分界,这世界上只有 2 种算法,YOLOv3 和其它。...原创 2020-12-05 23:37:49 · 1402 阅读 · 0 评论 -
死磕YOLO系列,YOLOv1 的大脑、躯干和手脚
YOLO 是我非常喜欢的目标检测算法,堪称工业级的目标检测,能够达到实时的要求,它帮我解决了许多实际问题。这就是 YOLO 的目标检测效果。它定位了图像中物体的位置,当然,也能预测物体的类别。之前我有写博文介绍过它,但是每次重新读它的论文,我都有新的收获,为此我准备写一个系列的文章来详尽分析它。这是第一篇,从它的起始 YOLOv1 讲起。YOLOv1 的论文地址:https://www.c...原创 2019-11-20 16:06:26 · 23171 阅读 · 44 评论 -
【深度学习】目标检测中 IOU 的概念及计算
在目标检测当中,有一个重要的概念就是 IOU。一般指代模型预测的 bbox 和 Groud Truth 之间的交并比。何为交并比呢?IOU=A∩BA∪BIOU = \frac{A\cap B}{A\cup B}IOU=A∪BA∩B集合 A 和集合 B 的并集包括了上面 3 种颜色区域。集合 C 是集合 A 与集合 B 的交集。在目标检测当中,IOU 就是上面两种集合的比值。A∪...原创 2019-06-10 11:59:45 · 37614 阅读 · 7 评论 -
【深度学习】轻量级神经网络 SqueezeNet 讲解
在深度学习领域,人们一般把注意力集中在如何提高神经网络的准确度上,所以,神经网络的层次越来越深,参数也越来越多,但带来的问题就是神经网络对于硬件的要求越来越高,但在嵌入式硬件上比如手机、自动驾驶的计算平台,这将很吃力,所以,有一些人会将精力放在如何精简和优化网络模型上,以便它们能够比较顺利运行在硬件条件有限的嵌入式设备上面。而 SqueezeNet 就是一种精简化的轻量级的卷积神经网络结构。小...原创 2018-12-13 21:44:04 · 21810 阅读 · 1 评论 -
【深度学习】目标检测算法 YOLO 最耐心细致的讲解
YOLO 是 2016 年提出来的目标检测算法,在当时比较优秀的目标检测算法有 R-CNN、Fast R-CNN 等等,但 YOLO 算法还是让人感到很新奇与兴奋。YOLO 是 You only look once 几个单词的缩写,大意是你看一次就可以预测了,灵感就来自于我们人类自己,因为人看一张图片时,扫一眼就可以得知这张图片不同类型目标的位置。YOLO 胜在它的简单与快速。YOLO 是...原创 2018-12-04 20:43:50 · 26275 阅读 · 6 评论 -
【深度学习】Batch Normalizaton 的作用及理论基础详解
对于 Batch Normalization 的知识最原始的出处来源于《Batch Normalization:Accelerating Deep Network Trainning by Reducing Internal Covariate Shift》这篇论文。文章开始前,先讲一下 Batch Normalization 有什么好处。加速神经网络的训练过程。减少对 Dropout 的...原创 2018-11-18 16:11:48 · 13300 阅读 · 0 评论 -
【深度学习】CNN 中 1x1 卷积核的作用
最近研究 GoogLeNet 和 VGG 神经网络结构的时候,都看见了它们在某些层有采取 1x1 作为卷积核,起初的时候,对这个做法很是迷惑,这是因为之前接触过的教材的例子中最小的卷积核是 3x3 ,那么,1x1 的卷积核有什么意义呢?最初应用 1x1 卷积核的神经网络是 Network In Network,然后 GoogLeNet 和 VGG 也不约而同的更正了。他们在论文中解释,大概有下...原创 2018-10-19 18:12:18 · 17830 阅读 · 3 评论 -
【深度学习】经典神经网络 ResNet 论文解读
ResNet 是何凯明团队的作品,对应的论文 《Deep Residual Learning for Image Recognition》是 2016 CVPR 最佳论文。ResNet 的 Res 也是 Residual 的缩写,它的用意在于基于残差学习,让神经网络能够越来越深,准确率越来越高。我们都知道,自 2012 年 AlexNet 在 ILSVRC 一战成名后,卷积神经网络便一发不可收拾...原创 2018-10-30 18:55:43 · 39334 阅读 · 0 评论 -
【深度学习】多通道图像卷积过程及计算方式
之前,有写了一篇博文,【深度学习入门】——亲手实现图像卷积操作介绍卷积的相应知识,但那篇文章更多的是以滤波器的角度去讲解卷积。但实际上是神经网络中该博文内容并不适应。之前的文章为了便于演示,针对的是二维卷积,比如一张图片有 RGB 三个颜色通道,我的方式是每个通道单独卷积,然后将各个通道合成一张图片,再可视化出来。但真实工程不会是这样的,很多东西需要进一步说明白。熟悉 TensorFlow 的...原创 2018-10-15 21:42:50 · 57282 阅读 · 42 评论 -
【深度学习入门】——亲手实现图像卷积操作
深度学习中有一个很重要的概念就是卷积神经网络 CNN,卷积神经网络中又有卷积层、池化层的概念。尤其是卷积层,理解难度比较大,虽然书中或者是视频中都有详细介绍过它的基础概念,但对于求知欲望很强烈的我,我总心里痒痒的,总想亲手实现,看看效果,怕的就是自己会眼高手低,做技术人最可怕的就是眼高手低。所以,我打算用 python 来亲自验证一遍。什么是卷积?卷积(convolution)是数学知...原创 2018-03-22 16:46:22 · 26919 阅读 · 12 评论 -
【深度学习】R-CNN 论文解读及个人理解
背景本篇论文的题目是 《Rich feature hierarchies for accurate oject detection and semantic segmentation》,翻译过来就是针对高准确度的目标检测与语义分割的多特征层级,通俗地来讲就是一个用来做目标检测和语义分割的神经网络。本文作者:Ross Girshick,JeffDonahue,TrevorDarrell,Ji...原创 2018-08-24 10:04:15 · 221793 阅读 · 39 评论