
深度学习
文章平均质量分 87
记录学习深度学习的过程。
孙同学要努力
这个作者很懒,什么都没留下…
展开
-
《深度学习》VGG网络
2014年,⽜津⼤学计算机视觉组(Visual Geometry Group)和GoogleDeepMind公司的研究员⼀起研发出了新的深度卷积神经⽹络:VGGNet,并取得了ILSVRC2014⽐赛分类项⽬的第⼆名,主要贡献是使⽤很⼩的卷积核(3×3)构建卷积神经⽹络结构,能够取得较好的识别精度,常⽤来提取图像特征的VGG-16和VGG-19。原创 2024-11-14 21:53:43 · 515 阅读 · 0 评论 -
《深度学习》AlexNet网络
2012年,AlexNet横空出世,该模型的名字源于论⽂第⼀作者的姓名AlexKrizhevsky。AlexNet使⽤了8层卷积神经⽹络,以很⼤的优势赢得了ImageNet 2012图像识别挑战赛。它⾸次证明了学习到的特征可以超越⼿⼯设计的特征,从⽽⼀举打破计算机视觉研究的⽅向。原创 2024-11-14 21:40:58 · 738 阅读 · 0 评论 -
《目标检测》R-CNN网络基础(RCNN,Fast-RCNN)
训练阶段多,训练耗时: 微调CNN⽹络+训练SVM+训练边框回归器。预测速度慢: 使⽤GPU, VGG16模型处理⼀张图像需要47s。占⽤磁盘空间⼤:5000张图像产⽣⼏百G的特征⽂件。数据的形状变化:候选区域要经过缩放来固定⼤⼩,⽆法保证⽬标的不变形CNN⽹络不再对每个候选区域进⾏特征提取,⽽是直接对整张图像进⾏特征提取,这样减少了很多重复计算。⽤ROI pooling进⾏特征的尺⼨变换,来满⾜FC全连接层对输⼊数据尺度的要求。原创 2024-11-14 20:42:28 · 1505 阅读 · 0 评论 -
卷积神经网络CNN——卷积层、池化层、全连接层
我们之前学习了全连接的神经网络,如下图:利用全连接神经网络对图像进行处理存在以下两个问题:CNN⽹络受⼈类视觉神经系统的启发,⼈类的视觉原理:从原始信号摄⼊开始(瞳孔摄⼊像素 Pixels),接着做初步处理(⼤脑⽪层某些细胞发现边缘和⽅向),然后抽象(⼤脑判定,眼前的物体的形状,是圆形的),然后进⼀步抽象(⼤脑进⼀步判定该物体是只⼈脸)。下⾯是⼈脑进⾏⼈脸识别的⼀个示例:CNN网络主要有三部分构成:卷积层、池化层和全连接层构成。其中卷积层是负责提取图像中的局部特征;池化层是用来答复降低参数量级(降维原创 2024-11-13 17:02:16 · 10015 阅读 · 0 评论 -
《目标检测》——基础理论知识(目标检测的数据集、评价指标:IOU、mAP、非极大抑制NMS)
Annotations下存放的是xml⽂件,描述了图⽚信息,如下图所示,需要关注的就是节点下的数据,尤其是bndbox下的数据.xmin,ymin构成了boundingbox的左上⻆,xmax,ymax构成了boundingbox的右下⻆,也就是图像中的⽬标位置信息。NMS的原理是对于预测框的列表B及其对应的置信度S,选择具有最⼤score的检测框M,将其从B集合中移除并加⼊到最终的检测结果D中.通常将B中剩余检测框中与M的IoU⼤于阈值Nt的框从B中移除.重复这个过程,直到B为空。原创 2024-11-08 15:37:33 · 1518 阅读 · 0 评论 -
全连接神经网络案例——手写数字识别
使⽤⼿写数字的MNIST数据集如上图所示,该数据集包含60,000个⽤于训练的样本和10,000个⽤于测试的样本,图像是固定⼤⼩(28x28像素),其值为0到255。原创 2024-11-07 20:20:30 · 807 阅读 · 0 评论 -
《深度学习》——深度学习基础知识(全连接神经网络)
在介绍神经网络之前,我们先看下面这幅图:人工智能>机器学习>深度学习深度学习是机器学习的⼀个⼦集,也就是说深度学习是实现机器学习的⼀种⽅法。与机器学习算法的主要区别如下图所示:传统机器学习依赖于人工设计特征,并进行特征提取,而深度学习算法不需要人工,而是依赖算法自动提取特征,这也是深度学习被看做黑盒子、可解释性差的原因。卷积神经网络(CNN)循环神经网络(RNN)生成对抗网络(GAN)深度强化网络(DRN)原创 2024-11-07 20:20:01 · 1407 阅读 · 1 评论