
计算机视觉与深度学习
文章平均质量分 82
计算机视觉与深度学习笔记
stdcoutzrh
MachineLearning/ComputerVision
展开
-
应用于图像识别的深度残差网络:ResNet
应用于图像识别的深度残差网络:ResNet1.论文背景2.论文工作2.1 BN层2.2 残差块2.3 34层ResNet网络结构1.论文背景《Deep Residual Learning for Image Recognition》ResNet是微软MSRA何凯明团队在2015年ImageNet上使用的网络,在当年的classification、detection、localization比赛中,ResNet均获了第一名的好成绩。2.论文工作作者首先提出了在加深网络深度进行训练时发现的问题:只是进行原创 2021-06-12 19:44:42 · 965 阅读 · 2 评论 -
应用于大规模图像识别的深层卷积神经网络:VGG
VGG网络1.论文背景2.论文工作3.网络搭建1.论文背景VGG论文背景:VGG网络 《VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION》是ILSVRC2014图像分类比赛中第二名的网络,由英国牛津大学的Visual Geometry Group组提出。2.论文工作VGG数据预处理:各通道减去RGB在训练集上的均值。VGG网络结构:主要看VGG16(下图D)和VGG19(下图E):VGG完成的工作:试验了小原创 2021-06-12 19:39:47 · 478 阅读 · 0 评论 -
基于卷积神经网络的图像分类:AlexNet
AlexNet和VGG是深度学习应用于图像分类问题的经典之作。这两个网络的Paper里包含了很多重要的概念以及网络训练时的技巧。首先是《ImageNet Classification with Deep ConvolutionalNeural Networks》,这篇论文的地址如下:https://www.onacademic.com/detail/journal_10000399138642...原创 2019-06-14 13:08:53 · 2069 阅读 · 0 评论 -
神经网络的正向传递与反向传播
神经网络之正向传递与反向传播1.单个神经元2.由神经元组成的神经网络3.目标函数4.反向传播算法1.单个神经元神经网络是由一系列神经元组成的模型,每一个神经元实际上做得事情就是实现非线性变换。如下图就是一个神经元的结构:神经元将两个部分:上一层的输出 (x1,x2...,xn)(x_1,x_2...,x_n)(x1,x2...,xn)与权重(w1,w2...,wn)(w_1,w_2...原创 2020-04-19 19:19:57 · 4163 阅读 · 3 评论 -
神经网络基础:从一个线性模型说起
神经网络基础1.从一个线性模型说起1.1 一个通用的模式识别流程1.2 一个线性分类器1.3 softmax函数2.损失函数2.1 one-hot编码2.2 交叉熵损失函数 Cross-Entropy Loss2.2 折页损失 Hinge Loss1.从一个线性模型说起1.1 一个通用的模式识别流程我们以图像分类为例,如上图所示假如我们要识别一个订书机,从机器学习的角度来看需要做如下几步:...原创 2020-04-19 15:00:23 · 442 阅读 · 0 评论