饕餮&化骨龙-优快云博客

原创 pytorch的数据可视化

pytorch的数据可视化需要先安装TensorBoard。如果使用Anaconda，则需要进入相应的虚拟环境安装该包。pip install tensorflow-tensorboard==1.5.1pip install tensorboard==1.14.0注意，tensorboard的版本需要大于等于1.14.0，否则在pytorch环境下使用会报错。下面以简单线性回归模型为例，使用线性回归模型进行经典的波士顿房价预测，并对训练损失过程进行可视化展示。import torchimpor

2022-01-11 09:32:42 1111

原创 pytorch模型的保存和加载

在训练深度学习模型的过程中，周期性地对模型做存档（Checkpoint）非常重要。一方面，深度模型的训练一般是一个长期的过程，训练过程中会出现各种问题，比如硬件错误或者断电等；另一方面，训练好的模型后需要对实际数据进行预测（Predict，或称为推理Inference），这时候就需要把模型的权重保存到硬盘中，方便后续直接调用模型进行预测。1. 模块和张量的序列化及反序列化pytorch的一系列方法，可以将torch.nn.Module和torch.tensor类等的实例转换成字符串，这些实例可以通过Py

2022-01-10 09:46:04 2319

原创 pytorch中的数据输入和预处理

1. 数据载入类pytorch数据载入使用的是torch.utils.data.DataLoader类，该类的的签名如下。from torch.utils.data import DataLoaderDataLoader(dataset, batch_size=1, shuffle=False, sampler=None, batch_sampler=None, num_workers=0, collate_fn=None, pin_memory=Fa

2022-01-08 10:04:01 822

原创 pytorch的损失函数和优化器

1. 损失函数pytorch的损失函数可以调用torch.nn.functional库中的函数，通过传入神经网络预测值和目标值来计算损失函数；也可以使用torch.nn中的模块，新建一个模块实例，通过调用相关的模块计算最终的损失函数。训练数据一般是以迷你批次的形式输入神经网络，最后预测的值也是迷你批次的形式输出，但实际上损失函数的输出结果应该是一个标量张量。所以，对于迷你批次的归约，一种方法是对迷你批次的损失函数求和，另一种是对迷你批次的损失函数求平均。一般默认的是对迷你批次的损失函数求平均。对于回归

2022-01-06 22:05:56 1991

原创 pytorch的计算图和自动求导机制

1. 自动求导机制pytorch会根据就算过程自动生成动态图，然后可以根据动态图的创建过程进行反向传播，计算得到每个节点的梯度。在创建张量的时候设置requires_grad=True可以将该张量加入到计算图中。torch.autograd为pytorch的自动求导包，有torch.autograd.backward函数和torch.autograd.grad函数，其中torch.autograd.backward函数通过传入根节点张量，以及初始梯度张量（形状和当前张量相同），可以计算产生该该根节点所有对

2022-01-05 20:31:06 1214

原创 pytorch中的模块简介

1. 模块类pytorch可以通过继承模块类来自定义模型的实例化，对内部定义的模块进行实例化，再通过前向计算调佣子模块，从而完成深度学习模型的搭建。import torch.nn as nnclass Model(nn.Module): def __init__(self, ...): # 模块初始化，...为用户的输入参数 super(Model, self).__init__() # 继承父类的方法 ... # 根据传入的参数来定义子模块

2022-01-03 22:00:39 691

原创 pytorch中张量的运算

在深度学习中，经常需要对张量做四则、线性变换和激活等。1. 单个张量的函数运算t = torch.rand(2, 2) # 产生一个3x3的张量print(t)print(t.sqrt()) # 张量的平方根，张量内部方法print(torch.sqrt(t)) # 张量的平方根，函数形式print(t.sqrt_()) # 平方根原地操作print(torch.sum(t)) # 所有元素求和print(torch.sum(t, 0)) # 第0维元素求和print(torc

2022-01-01 21:01:37 3235

原创 pytorch中张量的创建和维度的操作

张量的运算是深度学习的基本操作，深度学习框架的重要功能之一就是支持张量的定义与运算。1. 张量的数据类型数据pytorch类型CPU上的张量GPU上的张量32位浮点数torch.float32torch.floattorch.FloatTensortorch.cuda.FloatTensor64位浮点数torch.float64torch.doubletorch.DoubleTensortorch.cuda.DoubleTensor16位浮点数torch

2021-12-30 09:24:44 1789

原创 pytorch的辅助功能模块

1. torch.utils.bottleneck模块torch.utils.bottleneck可以用来检查深度学习模型中的运行时间，从而可以找到导致性能瓶颈的那些模块，并优化那些模块的运行时间，进而优化整个深度学习模型的性能。例：python -m torch.utils.bottleneck /path/to/source/script.py [args]2. torch.utils.checkpoint模块torch.checkpoint可以用来节约深度学习使用的内存。因为要进行梯度反传

2021-12-28 21:45:20 927

原创 pytorch的主要模块

1. torch模块torch模块包含了一些pytorch的常用激活函数，如Sigmoid（torch.sigmoid）、ReLu（torch.relu）和Tanh（torch.tanh）；同时也包含了pytorch张量的一些计算操作，如矩阵的乘法（torch.mm）、张量元素的选择（torch.select）。注意，该模块中计算的对象大多数是pytorch张量。例：a = torch.randn(1,2,3,4,5)torch.numel(a)2. torch.Tensor模块torch.

2021-12-27 10:37:06 2757

原创 pytorch深度学习框架基础知识

1. 张量在深度学习中，张量的计算是核心，一张迷你批次大小的图片可以看成四维的张量，一个迷你批次的文本可以看成二维张量或更高维度的张量。张量在内存中是从最后一个维度开始的连续排列的。张量可以支持每一个维度的长度，也支持四则运算，如加、减、乘、除等，另外，还支持变换维度。张量可以把某个维度分裂成两个维度，也可以把多个维度合并成一个维度。张量支持线性变换的操作（如卷积层和全连接层）和对每个元素的激活函数操作。2. 计算图一般来说，神经网络需要记录运算的过程，并构建计算图的方法。在深度学习中，目前存在静态图

2021-12-26 10:50:35 492

原创 Python实现供应链数据分析

一、前言A市客户有意加盟380开设连锁门店，请根据A市已有销售点的销售数据分析，给予该客户铺货支持和经营策略建议。通过对部门的运营情况、财务状况、物流管理等不同维度的分析，评估该部门健康状况和发展趋势，指导平台发现问题并进行优化。主要二、任务分析分析销售数据基本信息。比较CBD店和社区店，确定新店铺的选址。比较各商品确定新销售店的主要铺货产品。分析销售数据的季节性特点，安排店员休假或培训时间以及订货量。分析社区店有哪些季节性很强的产品。三、完整代码实现（一）预处理供应链商品销售数据

2021-12-13 22:26:17 5727 5

原创 Python实现node2vec构建词向量

一、node2vec原理node2vec是由Perozzi 等学者提出的将 word2vec 的思想用于图节点表示学习的一种Deepwalk 算法, 该算法在Deepwalk的基础上改变了随机游走的序列生成方式, 通过半监督的方式学习ppp, qqq 两个超参数的值, 控制游走对深度和广度的趋向, 其中ppp控制跳向前节点邻居的概率, qqq控制跳向前节点非邻居的概率, 如图所示：当q>1q>1q>1时, 趋向于遍历临近ttt节点的x1x_1x1节点，即趋向于BFS；当p>1

2021-11-26 15:56:21 3112

原创 Python自动化填写问卷星问卷

本文使用pyhton实现常见的问卷星问卷自动化填写。如果出现智能验证，本文还不能有效绕过问卷星提交时出现的智能检测，还需要手动点击智能检测才能完成问卷的填写。在网络问卷中，我们常见的问题有单选题、多选题和李克勤量表题，如下图：单选题：多选题：李克勤量表题：本文就是实现了以上问题的问卷星问卷自动填写功能，大家可以根据自己问卷的需要添加其他问题的自动化填写功能。本文的半自动化填写问卷程序需要依赖浏览器驱动，笔者使用的是谷歌浏览器，所以需要下载chromedriver，且版本需要和目前自己的浏览

2021-11-20 16:12:23 7713 8

原创 tfidf和word2vec构建文本词向量并做文本聚类

一、相关方法原理1、tfidf2、word2vec3、文本聚类代码实现

2021-11-18 15:55:00 13866 11

原创 Python实现共现语义网络

一、共现语义网络原理共现语义网络是用于表示词与词之间的语义关系的一种网络理论，由美国人工智能专家司马贺在1973年提出的。其原理就是以词语为网络的结点，以沟通结点的共现次数表示词语之间的语义关系，构成一个彼此相互联系的网络，以达到理解自然语言句子的语义关系。二、中文分词构建共现语义网络首先要进行分词，通常可以使用Jieba和Snownlp做中文分词。笔者使用的数据是自己在招聘网站采集的岗位招聘要求信息数据，使用Jieba分词后保存到源数据，并使用pandas库把整个文件保存为csv文件，方便后续使用。

2021-11-10 10:21:30 21628 35

原创使用KL散度计算LDA主题模型的主题方差

一、需求分析我们知道LDA主题模型的最优主题数可以使用困惑度来衡量，但使用困惑度确定最优主题已经被论文证明其实是不适用的。那有没有一种可行的方法计算出最优主题数呢？答案是肯定的，很多论文都会使用主题方差确定最优主题数，本文就是基于主题方差得出最优的主题数。二、主题方差1、KL散度相对熵（relative entropy），又被称为Kullback-Leibler散度（Kullback-Leibler divergence），是一种度量两个概率分布（probability distribution）间

2021-11-09 19:02:26 2366 7

m0_45827246的博客