昇思+昇腾开发板+DeepSeek模型LoRA微调

原创

已于 2025-08-06 22:28:49 修改 · 300 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#deepseek #昇腾 #昇思 #CANN #Ascend

于 2025-08-06 22:00:42 首次发布

昇思+昇腾开发板+DeepSeek模型LoRA微调

LoRA微调原理

核心思想：冻结预训练模型权重，仅训练橙色的低秩适配矩阵（A/B矩阵）
优势：
- 训练参数量减少至全量微调的0.5%
- 显存占用降低50%以上
- 适配器权重仅需保存3MB（原模型5.6GB）

关键配置

config = LoraConfig(
task_type=TaskType.CAUSAL_LM,
target_modules=[“q_proj”, “k_proj”, “v_proj”, “gate_proj”, “up_proj”, “down_proj”],
inference_mode=False,
r=8, # 低秩维度
lora_alpha=32, # 缩放系数
lora_dropout=0.1
)

开启同步

通过mindspore.set_context(pynative_synchronize=True)开启同步，方便在出现问题时进行快速定位。
流程：
环境准备与检查 -> 代码下载 -> 权重下载 -> 其他环境准备 -> 启动运行

代码实现知识点1：

MindSpore在将数据预处理操作应用到数据集时，代码实现会和Hugging Face Tran

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

cftang9999

关注关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

昇思+昇腾开发板：DeepSeek 蒸馏模型在香橙派开发板的全流程开发实践与经验分享

前端基地

07-29

1021

2025 蛇年春节爆火的 DeepSeek 模型启发开发者关注轻量级蒸馏方案。本文以昇思 MindSpore 为框架，详解在香橙派开发板实现 DeepSeek 蒸馏模型的全流程：从基础环境搭建、模型开发微调，到推理部署与性能优化，同步分享嵌入式设备适配经验，助力开发者掌握边缘 AI 落地实践。

手把手教你用聆思CSK6大模型开发板接入DeepSeek+联网搜索功能

分享AI芯片开发经验

05-07

948

大模型语音交互接上联网功能可以让在使用DeepSeek 时检索互联网上的最新信息，确保获取到关于新闻热点、政策法规变动、最新科研成果等方面的及时且准确的内容。

参与评论您还未登录，请先登录后发表或查看评论

香橙派OriengePi AiPro 华为昇腾芯片开发板开箱测评

机器人梦想家 Bing Lee

05-30

5988

博主有幸受邀优快云测评香橙派与华为昇腾共同研发的OriengePi AiPro的开箱测评，本文会对正常使用的一些情况做记录，包括常用配置，docker配置使用，以及可能包含机器人相关的一些配置等，同时也会对产品的性能及使用的感受做分享。2023.12月初，香橙派联合华为发布了基于昇腾的Orange Pi AIpro开发板，提供8/20TOPS澎湃算力，能覆盖生态开发板者的主流应用场景，让用户实践各种创新场景，并为其提供配套的软硬件。而价格更是极为亲民。

【llm】——香橙派AIPRO跑qwen2.5-0.5B

怡宝2号

12-05

1169

香橙派AIpro，昇腾芯片跑qwen2.5-0.5B模型实测

昇思+昇腾开发板+DeepSeek模型推理和性能优化

cftang9999的专栏

08-06

998

流程：权重加载 -> 启动推理 -> 效果比较与调优 -> 性能测试 -> 性能优化权重加载如微调章节介绍，最终的模型包含两部分：base model 和 LoRA adapter，其中base model的权重在微调时被冻结，推理时加载原权重即可，LoRA adapter可通过PeftModel.from_pretrained进行加载。

昇思+昇腾开发板：昇思+昇腾开发板+DeepSeek介绍和模型开发与适配-心得

weixin_45366659的博客

08-06

758

在接触 “昇思 + 昇腾开发板：软硬结合玩转 DeepSeek 开发实战” 项目时，深入了解相关技术工具是首要任务。昇思 MindSpore 作为华为推出的全场景 AI 框架，有着独特优势。它提供 Python 编程范式，让开发者能用熟悉的 Python 原生控制逻辑构建复杂神经网络模型，极大简化了 AI 编程流程。其动静态图统一的编码方式更是一大亮点，开发者仅需变更一行代码，就能在动态图与静态图模式间切换，开发调试更便捷，性能体验也得以提升。

昇思学习营-昇思+昇腾开发板+DeepSeek介绍以及模型开发与适配学习心得

2401_86708586的博客

08-04

368

DeepSeek -R1-Distill-Qwen-1.5B模型开发与适配。一、昇思+昇腾开发板+DeepSeek介绍。二、模型开发与适配。

昇思学习营：昇思+昇腾开发板+DeepSeek学习心得

qq_42895473的博客

07-29

413

摘要：昇思学习营系统介绍了DeepSeek系列模型的技术创新与昇腾开发板实践应用。课程重点解析了DeepSeek V3/R1的MoE架构、慢思考模型等核心技术，包括预训练优化、后训练强化和推理部署方案。通过昇腾开发板实战，学员掌握了从模型微调到推理加速的全流程，实现了通信开销降低40%、推理吞吐提升2.8倍等性能突破。课程突出MindSpore框架的生态优势，涵盖Transformers支持、多模态生成等套件，为开发者提供了从边缘设备到服务器集群的完整AI解决方案路径。

昇思学习营-昇思+昇腾开发板+DeepSeek学习心得

weixin_51603758的博客

08-03

309

昇思学习营-昇思+昇腾开发板+DeepSeek学习心得。

昇思+昇腾开发板：基于昇思平台使用 LoRA 微调模型模仿甄嬛语气对话

前端基地

08-06

1071

本文介绍在昇思大模型平台单卡环境下，用 LoRA 方法微调 DeepSeek-R1-Distill-Qwen-1.5B 模型，使其模仿《甄嬛传》甄嬛语气对话。涵盖环境准备、数据集处理及微调执行等关键步骤，助力高效实现模型风格迁移。

添越智创基于 RK3588 开发板部署测试 DeepSeek 模型全攻略

Itayga_tianyue的博客

02-14

1142

从运行监测数据能看到，模型回复时 CPU 负载瞬间飙升至百分之百，满负荷运转，而开发板强大的 NPU 却闲置一旁，无法发挥加速运算优势，这在一定程度上限制了模型的运行效率与性能表现。部署过程中难免遇到问题，这是技术探索的必经之路。可将浮点模型量化为定点模型，这一过程不仅能有效减少模型存储空间，还能大幅降低计算量，显著提升模型在硬件上的运行效率。凭借这些卓越的硬件性能，RK3588 开发板在保持低功耗的同时，展现出强大的运算能力，无疑是部署 DeepSeek 模型的不二之选，为后续的技术实践筑牢了硬件根基。

【变换域数字水印技术：一种信息隐藏的方法】使用多幅图像作为水印的数字水印技术，该技术基于变换域函数，包括离散小波变换（DWT）、离散余弦变换（DCT）和奇异值分解（SVD）（Matlab代码实现）

12-24

【变换域数字水印技术：一种信息隐藏的方法】使用多幅图像作为水印的数字水印技术，该技术基于变换域函数，包括离散小波变换（DWT）、离散余弦变换（DCT）和奇异值分解（SVD）（Matlab代码实现）内容概要：本文介绍了一种基于变换域函数的多幅图像数字水印技术，主要采用离散小波变换（DWT）、离散余弦变换（DCT）和奇异值分解（SVD）相结合的方法，在Matlab环境中实现水印的嵌入与提取。该技术通过在变换域中处理宿主图像和水印图像，增强了水印的鲁棒性和不可见性，适用于版权保护、数据认证等场景。文中详细阐述了算法流程、关键技术环节及其实现代码，展示了该方法在抵抗常见图像攻击方面的有效性。; 适合人群：具备数字图像处理基础，熟悉Matlab编程，从事信息安全、多媒体技术或相关领域研究的研究生及科研人员。; 使用场景及目标：①实现多幅图像作为水印的信息隐藏；②提升水印在复杂攻击下的鲁棒性与透明性；③为学术研究和工程应用提供可复现的Matlab代码参考；阅读建议：建议读者结合Matlab代码逐步调试算法流程，深入理解DWT、DCT与SVD在水印技术中的协同作用，并可通过添加不同攻击测试来验证算法性能。

（52页PPT）课时27第二单元汉语拼音8zhchshr课件.pptx

12-24

（52页PPT）课时27第二单元汉语拼音8zhchshr课件.pptx

SCI级别多策略改进鲸鱼优化算法(HHWOA)和鲸鱼优化算法(WOA)在CEC2017测试集函数F1-F30寻优对比

12-24

【SCI级别】多策略改进鲸鱼优化算法(HHWOA)和鲸鱼优化算法(WOA)在CEC2017测试集函数F1-F30寻优对比内容概要：本文主要介绍了多策略改进鲸鱼优化算法（HHWOA）与传统鲸鱼优化算法（WOA）在CEC2017测试集的30个基准函数（F1-F30）上的寻优性能对比研究。通过引入多种优化策略对原始WOA进行改进，提升了算法的收敛速度、全局搜索能力和避免陷入局部最优的能力。实验结果表明，HHWOA在多数测试函数上表现优于标准WOA，验证了所提改进策略的有效性。该研究为智能优化算法的性能提升提供了可行的技术路径，并适用于复杂工程优化问题的求解。; 适合人群：具备一定算法基础的研究生、科研人员及从事智能优化、人工智能、自动化等领域工作的工程技术人员，熟悉MATLAB编程者更佳。; 使用场景及目标：①用于解决复杂的数值优化问题，如工程参数优化、机器学习超参数调优等；②作为智能优化算法教学与研究的案例，帮助理解鲸鱼优化算法的原理及其改进方法；③为相关领域提供高性能优化工具的开发参考。; 阅读建议：建议结合提供的Matlab代码实现进行实验复现，深入理解算法细节与改进策略的作用机制，同时可通过更换测试函数或应用场景进一步拓展研究深度。

（51页PPT）天津欢乐谷万圣音乐节电音节潮流文娱活动方案.pptx

12-24

（51页PPT）天津欢乐谷万圣音乐节电音节潮流文娱活动方案.pptx

负荷预测基于VMD-CNN-LSTM的负荷预测研究（Python代码实现）

最新发布

12-24

【负荷预测】基于VMD-CNN-LSTM的负荷预测研究（Python代码实现）内容概要：本文介绍了基于变分模态分解（VMD）、卷积神经网络（CNN）和长短期记忆网络（LSTM）相结合的VMD-CNN-LSTM模型在负荷预测中的研究与应用，采用Python代码实现。该方法首先利用VMD对原始负荷数据进行分解，降低序列复杂性并提取不同频率的模态分量；随后通过CNN提取各模态的局部特征；最后由LSTM捕捉时间序列的长期依赖关系，实现高精度的负荷预测。该模型有效提升了预测精度，尤其适用于非平稳、非线性的电力负荷数据，具有较强的鲁棒性和泛化能力。; 适合人群：具备一定Python编程基础和深度学习背景，从事电力系统、能源管理或时间序列预测相关研究的科研人员及工程技术人员，尤其适合研究生、高校教师及电力行业从业者。; 使用场景及目标：①应用于日前、日内及实时负荷预测场景，支持智慧电网调度与能源优化管理；②为研究复合型深度学习模型在非线性时间序列预测中的设计与实现提供参考；③可用于学术复现、课题研究或实际项目开发中提升预测性能。; 阅读建议：建议读者结合提供的Python代码，深入理解VMD信号分解机制、CNN特征提取原理及LSTM时序建模过程，通过实验调试参数（如VMD的分解层数K、惩罚因子α等）优化模型性能，并可进一步拓展至风电、光伏等其他能源预测领域。

差动驱动约束下多机器人平滑无碰撞导航.zip

12-24

1.版本：matlab2014a/2019b/2024b 2.附赠案例数据可直接运行。 3.代码特点：参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象：计算机，电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。

【轴承故障诊断】基于融合鱼鹰和柯西变异的麻雀优化算法OCSSA-VMD-CNN-BILSTM轴承诊断研究【西储大学数据】（Matlab代码实现）

12-24

【轴承故障诊断】基于融合鱼鹰和柯西变异的麻雀优化算法OCSSA-VMD-CNN-BILSTM轴承诊断研究【西储大学数据】（Matlab代码实现）内容概要：本文研究了一种基于融合鱼鹰和柯西变异的麻雀优化算法（OCSSA）优化变分模态分解（VMD）参数，并结合卷积神经网络（CNN）与双向长短期记忆网络（BiLSTM）的轴承故障诊断模型。该方法利用西储大学轴承数据集进行验证，通过OCSSA算法优化VMD的分解层数K和惩罚因子α，有效提升信号去噪与特征提取能力；随后利用CNN提取故障特征的空间信息，BiLSTM捕捉时间序列的长期依赖关系，最终实现高精度的轴承故障识别。整个流程充分结合了智能优化、信号处理与深度学习技术，显著提升了复杂工况下故障诊断的准确性与鲁棒性。; 适合人群：具备一定信号处理、机器学习及MATLAB编程基础的研究生、科研人员及从事工业设备故障诊断的工程技术人员。; 使用场景及目标：①解决传统VMD参数依赖人工经验选择的问题，实现自适应优化；②构建高效准确的轴承故障诊断模型，适用于旋转机械设备的智能运维与状态监测；③为类似机电系统故障诊断提供可借鉴的技术路线与代码实现参考。; 阅读建议：建议结合提供的Matlab代码进行实践操作，重点关注OCSSA算法的设计机制、VMD参数优化过程以及CNN-BiLSTM网络结构的搭建与训练细节，同时可尝试在其他故障数据集上迁移应用以加深理解。

创新！高级！【日前、日内非滚动、日内滚动调度以及实时修正】考虑需求侧响应的智慧楼宇多时间尺度调度策略（Matlab代码实现）

12-24

创新！高级！【日前、日内非滚动、日内滚动调度以及实时修正】考虑需求侧响应的智慧楼宇多时间尺度调度策略（Matlab代码实现）内容概要：本文介绍了一种创新的智慧楼宇多时间尺度调度策略，涵盖日前、日内非滚动、日内滚动调度及实时修正四个阶段，并充分考虑了需求侧响应机制。该策略通过构建精细化的数学模型，结合Matlab代码实现，对智慧楼宇内的能源设备进行优化调度，旨在提升能源利用效率、降低运行成本并增强系统对可再生能源波动的适应能力。文中详细阐述了各时间尺度下的调度逻辑与协同机制，体现了较强的系统性与实用性。; 适合人群：具备一定电力系统或能源管理背景，熟悉优化算法与Matlab编程的科研人员、研究生及从事智能建筑、微电网调度相关工作的工程师。; 使用场景及目标：①应用于智慧楼宇、园区微网等场景下的多能源协同优化调度；②支持含光伏、储能、空调、照明等可控负荷的综合能源系统动态调控；③为需求响应机制下的电价互动与负荷调节提供技术方案与仿真验证手段。; 阅读建议：建议读者结合提供的Matlab代码逐阶段运行与调试，深入理解不同调度模式的建模思路与求解过程，同时可拓展至其他优化算法或实际应用场景中进行对比分析与二次开发。

如何在开发板上部署deepseek

02-25

### 部署 DeepSeek 至开发板 #### 开发板兼容性要求为了成功部署 DeepSeek 到开发板，确保所选硬件平台具备足够的计算资源来支持所需的操作。通常情况下，推荐选用具有高性能处理器和支持 GPU 加速的开发板。对于...