
PyTorch
文章平均质量分 95
云端FFF
not because they are easy, but because they are hard
展开
-
Pytorch入门(7)—— 梯度累加(Gradient Accumulation)
本文介绍梯度累加技巧及其pytorch实现。该技巧通过延迟参数更新时机,允许模型在显存容量有限时使用更大的等效batch size进行训练原创 2024-05-24 17:43:30 · 3242 阅读 · 0 评论 -
Pytorch 多卡并行(3)—— 使用 DDP 加速 minGPT 训练
本文介绍如何使用 DDP 和混合精度训练方法来高效地训练一个 MinGPT 模型原创 2023-09-12 15:37:30 · 1667 阅读 · 2 评论 -
Pytorch 多卡并行(2)—— 使用 torchrun 进行容错处理
本文介绍如何使用 torchrun 框架改写 DDP 单机多卡并行代码,增强容错性和稳定性原创 2023-09-12 12:48:13 · 17261 阅读 · 7 评论 -
Pytorch 多卡并行(1)—— 原理简介和 DDP 并行实践
本文介绍多卡并行原理,并用一个简单的例子演示 Pytorch 中的 DDP 多卡并行代码写法原创 2023-09-11 21:45:48 · 2826 阅读 · 2 评论 -
Pytorch入门(6)—— 梯度计算控制
本文计算控制 Pytorch 中梯度计算的集中方法,包括设置 tensor.requires_grad 字段以及三种梯度计算模式,还会介绍容易与之混淆的模型评估模式原创 2023-09-11 07:43:17 · 1254 阅读 · 0 评论 -
在 Pytorch 中使用 TensorBoard
本文介绍 Pytorch 中 TensorBoard 的用法原创 2023-08-24 20:07:47 · 1799 阅读 · 0 评论 -
minGPT 代码详解(训练 GPT 模型执行两位数加法)
minGPT 是 GPT 模型的一个开源实现,因简洁干净解释性强而颇具教育意义。本文对该开源库实现的 GPT 代码进行详解,并给出一个使用它训练 GPT 模型计算两位数加法的例子原创 2023-07-31 04:59:31 · 4081 阅读 · 2 评论 -
经典机器学习方法(4)—— 感知机
感知机原理分析及 pytorch 代码实现原创 2022-08-25 21:15:14 · 541 阅读 · 0 评论 -
经典机器学习方法(3)—— 多层感知机
多层感知机原理分析及 pytorch 实现原创 2022-08-18 03:22:35 · 1081 阅读 · 0 评论 -
经典机器学习方法(2)—— Softmax 回归
softmax 回归是一种经典的分类算法,本文详细介绍其原理并给出 pytorch 实现代码原创 2022-05-08 01:31:53 · 1588 阅读 · 0 评论 -
经典机器学习方法(1)—— 线性回归
线性回归原理分析与 Pytorch 代码原创 2022-02-11 10:35:12 · 890 阅读 · 0 评论 -
Pytorch入门(5)—— 使用 GPU 进行计算
介绍在 pytorch 中使用 GPU 进行计算的方法原创 2022-09-19 20:56:00 · 5473 阅读 · 3 评论 -
Pytorch入门(4)—— Tensor和Module的保存与加载
结合代码介绍 pytorch 中 tensor 和 Module 示例的本地存储和加载方法原创 2022-09-16 11:04:32 · 2504 阅读 · 0 评论 -
Pytorch入门(3)—— 构造网络模型
结合代码说明 pytorch 中模型构造、参数访问及初始化、自定义网络层的方法原创 2022-09-14 03:36:08 · 613 阅读 · 0 评论 -
PyTorch入门(2)—— 自动求梯度
参考:《动手学深度学习(PyTorch版)》—— 李沐注意:由于本文是jupyter文档转换来的,代码不一定可以直接运行,有些注释是jupyter给出的交互结果,而非运行结果!!文章目录1. 基础概念2. Tensor3. 梯度3.1 示例3.2 向量求导3.3 中断梯度追踪3.4 在不影响反向传播的情况下修改Tensor的值深度学习中经常需要对函数求梯度(gradient)。PyTorch提供的 autograd 包能够根据输入和前向传播过程自动构建计算图,并执行反向传播。下面介绍如何使用 .原创 2021-11-04 14:03:49 · 780 阅读 · 0 评论 -
PyTorch入门(1)—— Tensor基本数据操作
参考:《深度学习框架PyTorch入门与实践》—— 陈云《动手学深度学习(PyTorch版)》—— 李沐注意:由于本文是jupyter文档转换来的,代码不一定可以直接运行,有些注释是jupyter给出的交互结果,而非运行结果!!文章目录1. 创建 Tensor2. 操作2.1 算数操作2.2 索引改变形状线性代数广播机制运算的内存开销Tensor 和 ndarray 的相互转换Tensor on GPUPyTorch中,张量torch.Tensor 是存储和变换数据的主要工具Ten.原创 2021-10-17 04:08:06 · 402 阅读 · 0 评论 -
在 pytorch 中加载和使用图像分类数据集 Fashion-MNIST
本文介绍在 pytorch 中加载和使用图像分类数据集 Fashion-MNIST 的方法原创 2022-04-22 15:47:02 · 3154 阅读 · 0 评论