
人工智能
文章平均质量分 87
AliceWanderAI
北邮自动化学院,研究方向:图像处理,机器学习
展开
-
深度学习模型的并行训练:数据并行VS模型并行
数据并行由于训练数据集太大,而无法一次将其全部载入内存。因此将数据集分为N份,分别装载到N个GPU节点中去进行梯度求导,然后将所有节点的求导结果进行加权平均,再sync update给所有节点(对于每个节点来说,我们使用相同的模型参数进行前向传播。)。然后继续进行下一步的训练,直到模型收敛或者提前停止训练。如上图所示,GPU1和GPU2上都装载有完整的模型,但是它们使用不同的子数据集Batch进行训练,每次每个节点的推导结果进行加权平均然后sync到所有的GPU节点上,再继续下一步迭代。.原创 2021-02-21 22:21:43 · 7081 阅读 · 0 评论 -
Switch Transformer模型解读-Introduction
论文相关资料论文 Switch Transformer: Scaling to Trillion Parameter Models with Simple and Efficient Sparsity下载地址https://arxiv.org/pdf/2101.03961.pdf github 代码:https://github.com/tensorflow/mesh/blob/master/mesh_tensorflow/transformer/moe.py论文解读Introduction原创 2021-01-23 22:26:09 · 1371 阅读 · 0 评论 -
NVIDIA Nsight Systems 入门及使用
目录# Nsight Systems 入门什么是Nsight Systems用户能用nsys做什么CUDA VersionNsight Systems 使用nsys windows 版本GUI使用步骤nsys Linux CLI (Command Line Interface)常见命令# Nsight Systems 入门什么是Nsight SystemsNVIDIA Nsight Systems,简称nsys,是一个低开销的系统分析工具。在本文档中,我..原创 2021-01-21 12:03:38 · 60050 阅读 · 5 评论 -
TorchScript学习笔记
学完本篇文章,您将学习到Torchscript的概念与相关知识 如何将Pytorch转化为torchscript 使用torchscript部署模型:https://cugtyt.github.io/blog/effective-pytorch/20190912.htmlTorchscript简介TorchScript 是 PyTorch 模型(nn.Module的子类)的中间表示形式,可以在高性能环境(例如 C ++)中运行。TorchScript是一种从PyTorch代码创建可..原创 2021-01-19 15:26:01 · 878 阅读 · 0 评论 -
Transformer & BERT 详解第1篇(共4篇)
本系列文章围绕以下几个主题来详细解读Transformer和BERT的原理和发展Transformer 模型详解 Transformer在CV,NLP,推荐系统的发展与应用 BERT模型详解 BERT最新发展与应用本篇文章:Transformer模型详解整体结构 Encoder Decoder Positional Encoding Self Attention Add & Norm1. 整体结构Transformer主要由两大部分组成:Encoder &.原创 2021-01-15 22:29:07 · 882 阅读 · 0 评论 -
人工智能的顶会有哪些
人工智能和机器学习技术的快速发展,使得AI 主题会议也层出不穷,下面带大家一起了解一下人工智能领域的顶会都有哪些1.CVPR国际计算机视觉与模式识别会议(CVPR)是IEEE一年一度的学术性会议,会议的主要内容是计算机视觉与模式识别技术。CVPR是世界顶级的计算机视觉会议(三大顶会之一,另外两个是ICCV和ECCV),近年来每年有约1500名参加者,收录的论文数量一般300篇左右。本会议每年都会有固定的研讨主题,而每一年都会有公司赞助该会议并获得在会场展示的机会。2.ECCVECCV的全称.转载 2020-11-16 23:02:34 · 4946 阅读 · 0 评论