昇思大模型
文章平均质量分 90
奇树谦
软件开发工程师,从事军工/制造行业近5年,擅长跨平台上位机软件搭建,可以完成从UI到底层通信全链路代码编写。记录工作生活中的所学所感,欢迎一起学习交流。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
《昇思25天学习打卡营第10天|初学教程/使用静态图加速》
AI编译框架分为两种运行模式,分别是动态图模式以及静态图模式。MindSpore默认情况下是以动态图模式运行,但也支持手工切换为静态图模式。原创 2024-08-01 09:06:43 · 1053 阅读 · 0 评论 -
《昇思25天学习打卡营第9天|初学教程/保存与加载》
在训练网络模型的过程中,实际上我们希望保存中间和最后的结果,用于微调(fine-tune)和后续的模型推理与部署,本章节我们将介绍如何保存与加载模型。要加载模型权重,需要先创建相同模型的实例,然后使用load_checkpoint和load_param_into_net方法加载参数。MindIR同时保存了Checkpoint和模型结构,因此需要定义输入Tensor来获取输入shape。已有的MindIR模型可以方便地通过load接口加载,传入nn.GraphCell即可进行推理。原创 2024-07-31 20:12:38 · 233 阅读 · 0 评论 -
《昇思25天学习打卡营第8天|初学教程/模型训练》
从网络构建中加载代码,构建一个神经网络模型。nn.ReLU(),nn.ReLU(),超参(Hyperparameters)是可以调整的参数,可以控制模型训练优化的过程,不同的超参数值可能会影响模型训练和收敛速度。目前深度学习模型多采用批量随机梯度下降算法进行优化,随机梯度下降算法的原理如下:公式中, 𝑛 是批量大小(batch size), η 是学习率(learning rate)。另外, 𝑤𝑡 为训练轮次 𝑡中的权重参数, ∇𝑙 为损失函数的导数。原创 2024-07-31 19:52:15 · 1212 阅读 · 0 评论 -
《昇思25天学习打卡营第7天|初学教程/函数式自动微分》
本章讲述了函数式自动微分,它主要解决的问题是将一个复杂的数学运算分解为一系列简单的基本运算,该功能对用户屏蔽了大量的求导细节和过程,大大降低了框架的使用门槛。接着讲述了函数与计算图的基本知识,计算图是用图论语言表示数学函数的一种方式,也是深度学习框架表达神经网络模型的统一方法。原创 2024-07-31 19:40:04 · 865 阅读 · 0 评论 -
《昇思25天学习打卡营第6天|初学教程/网络构建》
当我们定义神经网络时,可以继承nn.Cell类,在__init__方法中进行子Cell的实例化和状态管理,在construct方法中实现Tensor操作。construct意为神经网络(计算图)构建,相关内容详见使用静态图加速。nn.ReLU(),nn.ReLU(),构建完成后,实例化Network对象,并查看其结构。Network原创 2024-07-21 21:32:59 · 903 阅读 · 0 评论 -
《昇思25天学习打卡营第5天|初学教程/数据变换 Transforms》
通常情况下,直接加载的原始数据并不能直接送入神经网络进行训练,此时我们需要对其进行数据预处理。所有的Transforms均可通过map方法传入,实现对指定数据列的处理。本章学习了有关数据变换的相关操作,其中包括通用Transforms、针对图像数据的Transforms、针对文本数据的Transforms以及LambdaTransforms。mindspore.dataset提供了面向图像、文本、音频等不同数据类型的Transforms,同时也支持使用Lambda函数。的Transforms。原创 2024-07-21 19:55:13 · 963 阅读 · 0 评论 -
《昇思25天学习打卡营第4天|初学教程/数据集 Dataset》
mindspore.dataset模块提供了一些常用的公开数据集和标准格式数据集的加载API。对于MindSpore暂不支持直接加载的数据集,可以构造自定义数据加载类或自定义数据集生成函数的方式来生成数据集,然后通过GeneratorDataset接口实现自定义方式的数据集加载。GeneratorDataset支持通过可随机访问数据集对象、可迭代数据集对象和生成器(generator)构造自定义数据集,下面分别对其进行介绍。原创 2024-07-21 19:09:55 · 1076 阅读 · 0 评论 -
《昇思25天学习打卡营第3天|初学教程/张量 Tensor》
张量(Tensor)是一个可用来表示在一些矢量、标量和其他张量之间的线性关系的多线性函数,这些线性关系的基本例子有内积、外积、线性映射以及笛卡儿积。在向量空间的上下文中,如果 V 和 W 是两个向量空间,它们的笛卡儿积 V x W 可以被视为所有可能的向量对的集合,这些向量对可以看作是更高维度空间中的元素。在某些应用场景中(比如推荐系统、分子动力学、图神经网络等),数据的特征是稀疏的,若使用普通张量表征这些数据会引入大量不必要的计算、存储和通讯开销。这里的i, j,k 是三维空间的标准基向量。原创 2024-07-14 13:22:52 · 1134 阅读 · 0 评论 -
《昇思25天学习打卡营第2天|初学教程/快速入门》
MindSpore 的设计理念源于全产业的最佳实践,向数据科学家和算法工程师提供了统一的模型训练、推理和导出等接口,支持端、边、云等不同场景下的灵活部署,推动深度学习和科学计算等领域的繁荣发展。MindSpore 还提供了动态图和静态图统一的编码方式,这大大增加了静态图和动态图的可兼容性,用户无需开发多套代码,通过简单的模式切换就能在动态图和静态图模式之间转换,从而提供了更轻松的开发调试及性能体验。(内核(Kernel)是计算机操作系统的核心组件,负责管理系统资源,如CPU时间、内存和输入/输出设备等。原创 2024-07-14 12:07:56 · 870 阅读 · 0 评论 -
《昇思25天学习打卡营第1天|初学教程/基本介绍》
整体介绍昇思MindSpore和华为昇腾AI全栈,并介绍昇思MindSpore在华为昇腾AI全栈中的位置。原创 2024-07-05 12:38:38 · 424 阅读 · 0 评论
分享