基于PyTorch框架的模型训练调优

本文介绍了PyTorch框架的性能分析工具pytorchprofiling和cannprofiling,探讨了三种模型参数迁移方法,并提出了提升模型性能的策略,如在ARM架构下绑核和使用混合精度训练。此外,还讨论了处理动态shape模型的训练方法,包括固定shape、模糊编译和分档。首次训练慢是因为模型编译,第二次训练速度会提升。

PyTorch框架全景介绍:

性能分析工具pytorch profiling

性能分析工具cann profiling

pytorch模型参数迁移(三种方法):

方法一:将原来预训练好的模型参数迁移到新的resnet18网络架构中,只有迁移两者相同的模型参数,不同的参数还是随机初始化。

方法二:修改网络名称并迁移学习

方法三:去除原模型的某些模块

在npu上训练,必须使用混合精度

一般来说,衡量模型性能的数据是看单step单位时间内的数据吞吐量

查看模型算子耗时的工具是cann profiling

宏观查看模型性能的工具是pytorch profiling

cann profiling的模型性能数据比pytorch profiling的更准确。

以下方法可以提升模型性能:

arm架构下绑核启动程序

使用融合优化器

使用npu亲和算子

有动态shape的模型,可以使用如下方法进行训练:

固定shape

模糊编译

分档

arm架构下,使用绑核的方式启动模型训练,性能会得到一定的提升。

第一次训练模型启动比较慢,是因为模型在编译,第二次启动训练,速度会明显提升。
 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

程序员奇奇

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值