昇思25天学习打卡营第1天 | 初探“孢子”-MindSpore

最新推荐文章于 2025-05-05 19:30:25 发布

樱花穿过千岛湖

最新推荐文章于 2025-05-05 19:30:25 发布

阅读量1.2k

点赞数 32

文章标签：学习 python 机器学习人工智能深度学习华为

本文链接：https://blog.youkuaiyun.com/qq_51279133/article/details/139795375

版权

文章目录

基本了解
- 何为孢子（MindSpore）
- 华子的 AI 布局
入门初探

基本了解

何为孢子（MindSpore）

昇思MindSpore是一个全场景深度学习框架，旨在实现易开发、高效执行、全场景统一部署三大目标。
其中，易开发表现为API友好、调试难度低；高效执行包括计算效率、数据预处理效率和分布式训练效率；全场景则指框架同时支持云、边缘以及端侧场景。
我总结如下几个优点：

易用性：MindSpore 框架的 API 设计简洁明了，易于学习和使用。
性能：MindSpore 框架在昇腾 AI 处理器上具有出色的性能表现。
灵活性：MindSpore 框架支持多种编程语言和硬件平台，具有很强的灵活性。

其设计理念包括：

支持全场景统一部署
提供Python编程范式，简化AI编程
提供动态图和静态图统一的编码方式
采用AI和科学计算融合编程，使用户聚焦于模型算法的数学原生表达
分布式训练原生

层次结构：
MindSpore API

华子的 AI 布局

昇腾AI全栈如下图所示：

昇腾全栈
下面简单介绍每个模块的作用以及分别对标的对象：

昇腾应用使能：华为各大产品线基于MindSpore提供的AI平台或服务能力。对标各类 AI 产品，如盘古大模型（to B）与 ChatGPT（to C）
MindSpore：支持端、边、云独立的和协同的统一训练和推理框架。对标 pytorch 和 tensorflow 等主流开源框架
CANN：昇腾芯片使能、驱动层。对标英伟达 CUDA + CuDNN
计算资源：昇腾系列化IP、芯片和服务器。对标 GPU 和各类计算卡

注：这里说的“对标”二字可能不太准确，但是大概就是那个意思

入门初探

处理数据集

MindSpore提供基于Pipeline的数据引擎，通过数据集（Dataset）和数据变换（Transforms）实现高效的数据预处理。
MNIST数据集目录结构如下：

MNIST_Data
└── train
├── train-images-idx3-ubyte (60000个训练图片)
├── train-labels-idx1-ubyte (60000个训练标签)
└── test
├── t10k-images-idx3-ubyte (10000个测试图片)
├── t10k-labels-idx1-ubyte (10000个测试标签)

数据下载完成后，获得数据集对象。

train_dataset = MnistDataset('MNIST_Data/train')
test_dataset = MnistDataset('MNIST_Data/test')

打印数据集中包含的数据列名，用于dataset的预处理。

MindSpore的dataset使用数据处理流水线（Data Processing Pipeline），需指定map、batch、shuffle等操作。这里我们使用map对图像数据及标签进行变换处理，然后将处理好的数据集打包为大小为64的batch。

def datapipe(dataset, batch_size):
    image_transforms = [
        vision.Rescale(1.0 / 255.0, 0),
        vision.Normalize(mean=(0.1307,), std=(0.3081,)),
        vision.HWC2CHW()
    ]
    label_transform = transforms.TypeCast(mindspore.int32)

    dataset = dataset.map(image_transforms, 'image')
    dataset = dataset.map(label_transform, 'label')
    dataset = dataset.batch(batch_size)
    return dataset
    
# Map vision transforms and batch dataset
train_dataset = datapipe(train_dataset, 64)
test_dataset = datapipe(test_dataset, 64)

迭代访问，查看数据和标签的shape和datatype。

for image, label in test_dataset.create_tuple_iterator():
    print(f"Shape of image [N, C, H, W]: {image.shape} {image.dtype}")
    print(f"Shape of label: {label.shape} {label.dtype}")
    break
#或
for data in test_dataset.create_dict_iterator():
    print(f"Shape of image [N, C, H, W]: {data['image'].shape} {data['image'].dtype}")
    print(f"Shape of label: {data['label'].shape} {data['label'].dtype}")
    break

输出：
Shape of image [N, C, H, W]: (64, 1, 28, 28) Float32
Shape of label: (64,) Int32

网络构建

mindspore.nn类是构建所有网络的基类，也是网络的基本单元。当用户需要自定义网络时，可以继承nn.Cell类，并重写__init__方法和construct方法。__init__包含所有网络层的定义，construct中包含数据（Tensor）的变换过程。

# Define model
class Network(nn.Cell):
    def __init__(self):
        super().__init__()
        self.flatten = nn.Flatten()
        self.dense_relu_sequential = nn.SequentialCell(
            nn.Dense(28*28, 512),
            nn.ReLU(),
            nn.Dense(512, 512),
            nn.ReLU(),
            nn.Dense(512, 10)
        )

    def construct(self, x):
        x = self.flatten(x)
        logits = self.dense_relu_sequential(x)
        return logits

model = Network()
print(model)

在这里插入图片描述

模型训练

在模型训练中，一个完整的训练过程（step）需要实现以下三步：

正向计算：模型预测结果（logits），并与正确标签（label）求预测损失（loss）。
反向传播：利用自动微分机制，自动求模型参数（parameters）对于loss的梯度（gradients）。
参数优化：将梯度更新到参数上。

MindSpore使用函数式自动微分机制，因此针对上述步骤需要实现：

定义正向计算函数。
使用value_and_grad通过函数变换获得梯度计算函数。
定义训练函数，使用set_train设置为训练模式，执行正向计算、反向传播和参数优化。

# Instantiate loss function and optimizer
loss_fn = nn.CrossEntropyLoss()
optimizer = nn.SGD(model.trainable_params(), 1e-2)

# 1. Define forward function
def forward_fn(data, label):
    logits = model(data)
    loss = loss_fn(logits, label)
    return loss, logits

# 2. Get gradient function
grad_fn = mindspore.value_and_grad(forward_fn, None, optimizer.parameters, has_aux=True)

# 3. Define function of one-step training
def train_step(data, label):
    (loss, _), grads = grad_fn(data, label)
    optimizer(grads)
    return loss

def train(model, dataset):
    size = dataset.get_dataset_size()
    model.set_train()
    for batch, (data, label) in enumerate(dataset.create_tuple_iterator()):
        loss = train_step(data, label)

        if batch % 100 == 0:
            loss, current = loss.asnumpy(), batch
            print(f"loss: {loss:>7f}  [{current:>3d}/{size:>3d}]")

训练过程需多次迭代数据集，一次完整的迭代称为一轮（epoch）。在每一轮，遍历训练集进行训练，结束后使用测试集进行预测。打印每一轮的loss值和预测准确率（Accuracy），可以看到loss在不断下降，Accuracy在不断提高。

epochs = 3
for t in range(epochs):
    print(f"Epoch {t+1}\n-------------------------------")
    train(model, train_dataset)
    test(model, test_dataset, loss_fn)
print("Done!")
import time
print(time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(time.time())), 'youlianzhong')

在这里插入图片描述
查看 npu 训练时运行状态的命令：

watch -n 0.1 npu-smi info

和 nvdia-smi 有点像。

我发现训练的时候 npu 并不能满载运行训练速度有点慢，不知道是不是数据量太小了，数据在加载的时候也比较慢。

保存和加载模型

保存模型参数

# Save checkpoint
mindspore.save_checkpoint(model, "model.ckpt")
print("Saved Model to model.ckpt")

加载保存的权重分为两步：

重新实例化模型对象，构造模型。
加载模型参数，并将其加载至模型上。

# Instantiate a random initialized model
model = Network()
# Load checkpoint and load parameter to model
param_dict = mindspore.load_checkpoint("model.ckpt")
param_not_load, _ = mindspore.load_param_into_net(model, param_dict)
print(param_not_load)

param_not_load是未被加载的参数列表，为空时代表所有参数均加载成功。

预测推理：

model.set_train(False)
for data, label in test_dataset:
    pred = model(data)
    predicted = pred.argmax(1)
    print(f'Predicted: "{predicted[:10]}", Actual: "{label[:10]}"')
    break