- 博客(8)
- 收藏
- 关注
原创 基于华为昇腾CANN的鸢尾花分类实战:从训练到端侧部署
鸢尾花分类是机器学习领域的"Hello World",数据集包含3种鸢尾花(Setosa、Versicolour、Virginica)的4个特征:花萼长度(sepal length)花萼宽度(sepal width)花瓣长度(petal length)花瓣宽度(petal width)我们的目标是构建一个深度学习模型,能够根据这4个特征准确分类鸢尾花类型。数据准备:加载、探索和预处理经典的鸢尾花数据集模型训练:使用PyTorch构建和训练深度学习分类器模型转换。
2025-11-26 22:54:00
245
原创 Ascend C 并行编程深度剖析:从任务切分到流水线优化
承接上篇《Ascend C 算子开发:零基础实战指南》,本文深入探讨如何通过并行编程技术释放昇腾芯片的强大算力。
2025-11-25 23:14:54
897
原创 大语言模型推理加速神器:华为CANN自定义融合算子原理解析
将多个连续的计算操作合并为单个计算单元。还是以一次性数据加载:将输入数据和所有权重参数加载到芯片高速缓存连续计算:在缓存中依次执行矩阵乘、偏置加、GELU激活一次性结果写回:仅将最终结果写回主内存这种"一气呵成"的计算方式,消除了中间结果的内存读写开销,实现了显著的性能提升。华为昇腾CANN的融合算子技术,通过减少内存访问降低调度开销和提高缓存利用率,为大语言模型推理带来了显著的性能提升。这项技术不仅体现了软硬件协同设计的重要性,也展示了AI基础设施优化的巨大潜力。技术层面。
2025-11-24 22:16:32
725
原创 基于华为昇腾CANN的深度学习房价预测实战
CANN(Compute Architecture for Neural Networks)是华为针对AI场景推出的异构计算架构,在昇腾AI生态中扮演着承上启下的关键角色。简单来说,CANN是对标英伟达CUDA的软硬件协同计算栈,包含运行时、编译器、算子库与SDK,用于将主流AI框架模型编译和加速到昇腾硬件上。下图展示了 CANN 在昇腾 AI 生态中的位置,以及其与上层 AI 框架和底层硬件的关系。置,以及其与上层 AI 框架和底层硬件的关系,帮助理解 CANN 承上启下的作用。
2025-11-24 21:44:55
812
原创 深度学习实战:ResNet原理与昇腾C++实践
本文提供了ResNet在昇腾平台上C++推理的完整实现方案,涵盖从原理到代码的各个环节,为深度学习模型部署提供实用参考。025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。获得Ascend C算子中级认证,即可领取精美证书,完成社区任务更有机会赢取华为手机,平板、开发板等大奖。报名链接:https://www.hiascend.com/developer/activities/cann20252。
2025-11-20 23:17:27
566
原创 YOLOv8 昇腾平台部署实战:从 ONNX 到边缘推理的全流程解析
摘要:本文详细介绍了YOLOv8目标检测模型在昇腾Atlas系列设备的端到端部署方案。重点阐述了从PyTorch模型到ONNX再到昇腾专属OM格式的转换流程,包括关键参数配置和常见问题解决方法。同时提供了基于AscendC++的推理引擎开发指南,涵盖模型加载、预处理、推理执行和后处理等核心环节。此外,文章还介绍了使用AMCT工具进行8bit量化优化的方法,量化后模型体积减少75%,推理速度提升40%,精度损失仅0.84%。最后给出了性能优化技巧和常见问题排查建议,为开发者在边缘设备上部署实时目标检测系统提供
2025-11-20 23:05:47
1122
1
原创 第二篇:Ascend C 核心模块拆解:从概念到技术细节
摘要:本文系统解析AscendC算子开发的四大模块:1)算子本质与分类(基础/复合算子、Host/Device执行类型、矢量/矩阵适配类型);2)AscendC技术架构(与CANN系统协同、达芬奇硬件三大计算单元适配);3)开发全流程(核函数定义-编译-部署闭环);4)数据类型与内存模型规范。通过"技术拆解+案例类比"方式,深入剖析算子作为AI任务最小执行单元的运行机制,强调Host-Device协同优化要点,为实战开发奠定理论基础。文章最后预告将进入环境搭建与"HelloWo
2025-11-19 15:45:26
1228
原创 昇腾AscendC算子昇腾AscendC算子开发:零基础实战指南开发:零基础实战指南
直击传统算子开发高门槛痛点,以 “技术解析 + 实战路径” 双主线,揭秘 Ascend C 如何通过多层接口抽象、自动并行等核心技术降低开发难度,结合 CANN 训练营 2025 第二季专属资源,为 0 基础开发者提供可落地的入门方案,快速开启昇腾算力开发之旅。
2025-11-18 21:43:58
858
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅