
动手深度学习
文章平均质量分 94
步步星愿
狭路相逢勇者胜
展开
-
CNN模型分析 | 4 Network In Network
ZFNet网络综述前言卷积神经网络(CNN)由卷积层和池化层交替组成。卷积层使用线性滤波器和底层receptive field做内积,然后接一个非线性的激活函数,得到的输出称作特征图(feature map)。CNN的卷积滤波器是底层数据块的广义线性模型(generalized linear model )(GLM),而且我们认为它的抽象程度较低。这里的抽象较低是指该特征对同一概念的变体是...原创 2019-12-02 20:14:36 · 382 阅读 · 0 评论 -
CNN模型分析 | 3 ZFNet
文章目录ZFNet网络AlexNet网络的设计思想主要设计贡献ZFNet对AlexNet网络进行的调整ZFNet网络的核心架构反卷积和反池化ZFNet网络ZFNet,Matthew D Zeiler在2013年发表卷积网络模型AlexNet网络的设计思想主要设计贡献可以理解为只是对AlexNet网络进行了微调使用新颖的可视化技术来一窥中间特征层的功能,以及分类的操作利用反卷积和反池...原创 2019-11-30 18:19:25 · 383 阅读 · 0 评论 -
CNN模型 | 2 AlexNet
利用Pytorch复现AlexNet网络根据吴恩达老师在深度学习课程中的讲解,AlexNet网络的基本流程为:代码如下:import torchimport torch.nn as nnimport torch.nn.functional as Ffrom torch.autograd import Variableclass AlexNet(nn.Module): de...原创 2019-06-15 17:30:11 · 662 阅读 · 0 评论 -
CNN模型 | 1 LeNet
前言最近几天闲得慌,然后突发奇想,决定整理最常用卷积神经网络,废话不多说,进入正题。文章目录LeNet网络LeNet的设计思想LeNet网络的核心结构传统网络的全连接FCkeras实现LeNet网络PyTorch实现LeNet网络LeNet网络LeNet的设计思想LeNet是在1998年由LeCun提出,3层神经网络,具备卷积层、Pooling层、FC网络、Sigmod层等,是现在各大变种...原创 2019-11-30 15:52:32 · 274 阅读 · 0 评论 -
CNN模型分析 | 5 利用Pytorch复现VGG-16网络
利用Pytorch复现VGG-16网络:根据吴恩达老师在深度学习课程中的讲解,AlexNet网络的基本流程为:代码如下:import mathimport torchimport torchvisionimport torch.nn as nnimport torch.nn.functional as Fimport torchvision.models as modelsfr...原创 2019-08-06 20:49:22 · 1485 阅读 · 3 评论 -
在离线服务器上创建深度学习虚拟环境
在离线服务器上创建深度学习虚拟环境一、安装虚拟机1.虚拟机软件和Ubuntu下载链接2.注意事项二、Linux平台下Anaconda虚拟环境配置1. Anaconda安装2. 配置自己所需的深度学习环境3. 打包虚拟环境传送到服务器三、使用Pycharm远程连接服务器四、附赠:常用的conda虚拟环境相关命令参考博客前言:有些学校的服务器只能采用内网的方式进行访问,无法访问外界的互联网,所以环境所需的配置文件大多只能采用U盘拷贝或者ssh内网传送。但是直接在离线的服务器上创建虚拟环境可能会出现一些问原创 2022-04-22 21:43:07 · 6441 阅读 · 2 评论 -
卷积神经网络AlexNet-VGG-GoogLeNet详解
文章目录深度卷积神经网络(AlexNet)AlexNet载入数据集训练使用重复元素的网络(VGG)VGG11的简单实现⽹络中的⽹络(NiN)GoogLeNetGoogLeNet模型深度卷积神经网络(AlexNet)LeNet: 在大的真实数据集上的表现并不尽如⼈意。1.神经网络计算复杂。2.还没有⼤量深⼊研究参数初始化和⾮凸优化算法等诸多领域。机器学习的特征提取:手工定义的特征提取函数...原创 2020-02-24 16:38:32 · 898 阅读 · 0 评论 -
卷积神经网络---LeNet
文章目录Convolutional Neural NetworksLeNet 模型获取数据和训练模型总结:Convolutional Neural Networks使用全连接层的局限性:图像在同一列邻近的像素在这个向量中可能相距较远。它们构成的模式可能难以被模型识别。对于大尺寸的输入图像,使用全连接层容易导致模型过大。使用卷积层的优势:卷积层保留输入形状。卷积层通过滑动窗口将同...原创 2020-02-21 16:11:23 · 528 阅读 · 0 评论 -
卷积神经网络---CNN基础组件认识
卷积神经网络基础本节我们介绍卷积神经网络的基础概念,主要是卷积层和池化层,并解释填充、步幅、输入通道和输出通道的含义。二维卷积层本节介绍的是最常见的二维卷积层,常用于处理图像数据。二维互相关运算二维互相关(cross-correlation)运算的输入是一个二维输入数组和一个二维核(kernel)数组,输出也是一个二维数组,其中核数组通常称为卷积核或过滤器(filter)。卷积核的尺寸通...原创 2020-02-21 14:25:54 · 1309 阅读 · 0 评论 -
梯度消失和梯度爆炸
文章目录梯度消失、梯度爆炸如何解决梯度消失和梯度爆炸问题随机初始化模型参数PyTorch的默认随机初始化Xavier随机初始化考虑环境因素协变量偏移标签偏移概念偏移梯度消失、梯度爆炸梯度消失和梯度爆炸考虑到环境因素的其他问题深度模型有关数值稳定性的典型问题是消失(vanishing)和爆炸(explosion)。当神经网络的层数较多时,模型的数值稳定性容易变差。假设一个层数为LLL...原创 2020-02-21 14:19:34 · 547 阅读 · 0 评论 -
自然语言处理---文本预处理
文章目录文本预处理读入文本分词建立字典将词转为索引用现有工具进行分词文本预处理文本是一类序列数据,一篇文章可以看作是字符或单词的序列,本节将介绍文本数据的常见预处理步骤,预处理通常包括四个步骤:读入文本分词建立字典,将每个词映射到一个唯一的索引(index)将文本从词的序列转换为索引的序列,方便输入模型读入文本我们用一部英文小说,即H. G. Well的Time Machine...原创 2020-02-19 10:48:55 · 1482 阅读 · 0 评论 -
线性回归-softmax分类-多层感知机-模型选择和优化问题
文章目录线性回归算法实现的基本要素模型数据集损失函数优化函数 - 随机梯度下降softmax的基本概念分类问题权重矢量神经网络图类别输出问题小批量矢量计算表达式交叉熵损失函数多层感知机的基本知识隐藏层表达公式激活函数模型选择、过拟合和欠拟合训练误差和泛化误差模型选择验证数据集K折交叉验证过拟合和欠拟合模型复杂度训练数据集大小解决过拟合和欠拟合的方法线性回归算法实现的基本要素模型线性回归假设...原创 2020-02-15 11:17:10 · 1566 阅读 · 0 评论