鲲鹏昇腾征文来了!

一、征文背景:

随着昇腾 CANN 开源生态、鲲鹏计算生态的快速发展,越来越多开发者投身于异构编程、模型部署、高性能计算等技术实践中,但实操过程中的 “入门门槛高、经验难复用、问题难定位” 等痛点,制约着技术落地效率。

为了汇聚开发者的实践智慧,让优质经验在社区流转,优快云 联合昇腾、鲲鹏社区发起本次技术征文活动 —— 诚邀各位技术博主分享昇腾 CANN、鲲鹏开发的实操经验、踩坑技巧,同时为优质内容创作者提供激励,共同推动国产技术生态的繁荣。

二、征文主题方向

本次征文分为昇腾篇、鲲鹏篇、公共运营篇三大板块,具体主题及可写作方向如下:并由昇腾官方限时开放素材库案例用于二次创作: AtomGit | GitCode - 全球开发者的开源社区,开源代码托管平台

(一)昇腾篇(合计 50 篇)

聚焦昇腾 CANN、Ascend NPU 等技术的实操与解读:

  1. 昇腾 CANN 开源仓解读和参与体验(10 篇)

写作方向:

  • CANN 开源仓核心模块(仓库结构、功能定位)解析
  • CANN 开源仓本地编译 / 调试踩坑记录
  • CANN 开源能力与商业版的差异对比

2、基于 CANN 开源仓的 Ascend C 异构编程与经验技巧(5 篇)

写作方向:

  • Ascend C 异构编程环境搭建全流程
  • Ascend C 算子开发基础案例(如矩阵运算)
  • Ascend C 性能调优技巧(内存 / 算力优化)
  • Ascend C 与其他异构编程框架的差异实践

3、基于 CANN 开源仓的 Catlass 横模库编程与经验技巧(8 篇)

写作方向:

  • Catlass 横模库核心能力(支持的模型类型、适配场景)
  • Catlass 横模库快速调用案例(如 CV 模型部署)
  • Catlass 横模库性能对比(与原生框架部署的效率差异)
  • Catlass 横模库适配自定义模型的踩坑记录

4、Triton-ascend 编程与经验技巧(10 篇)

写作方向:

  • Triton-ascend 环境部署与基础配置
  • 基于 Triton-ascend 的模型推理服务搭建
  • Triton-ascend 多模型并行调度实践
  • Triton-ascend 性能调优(延迟 / 吞吐优化)

5、(MLIR) AscendNPU IR 开源与特性解读(7 篇)

写作方向:

AscendNPU IR 核心语法 / 结构解析

MLIR 框架下 AscendNPU IR 的编译流程

AscendNPU IR 对昇腾硬件的适配优势

基于 AscendNPU IR 的自定义优化案例

6、模型部署调优实践与工具链使用指南(10 篇)

写作方向:

昇腾模型部署全流程(从训练模型到 Ascend NPU 推理)

昇腾模型调优工具链(如 Profiling 工具)使用教程

大模型在昇腾硬件上的部署踩坑与优化

不同行业场景(如工业、医疗)下的昇腾模型部署实践

(二)鲲鹏篇(合计 20 篇)

聚焦鲲鹏计算生态的开发与实践:

1、鲲鹏 Boostkit 场景开发实践与技巧(10 篇)

写作方向:

BoostKit开源代码解读(开源开放地图-鲲鹏社区,从中选择一个或多个开源代码仓进行代码解读)

BoostKit性能优化原理解读(鲲鹏应用使能套件 BoostKit-鲲鹏社区,选择一个或多个BoostKit领域套件,解读性能优化实现原理,以及与开源产品的性能对比)

2、鲲鹏 Devkit 软件工程与持续集成实践经验(5 篇)

写作方向:

基于鲲鹏 Devkit 流水线工具的持续集成部署(CI/CD)经验分享(包含流水线搭建、DevKit流水线工具集成、使用方法、经验分享)

鲲鹏DevKit工具使用经验分享(迁移、调优、诊断、测试等方向选择一个或多个)

3、鲲鹏 HPC 高性能计算应用实践(5 篇)

写作方向:

基于鲲鹏平台进行高性能计算开发需要掌握的技术栈介绍,以及围绕这些技术展开的介绍和使用教程

HPC 经典应用(如流体仿真、气象模拟、油气、EDA等)在鲲鹏平台的开发、迁移、调优经验分享

鲲鹏 HPC 集群的性能调优(并行计算优化)

鲲鹏 HPC 与昇腾 AI 协同的超算场景实践。

(三)公共运营篇(合计 3 篇)

①鲲鹏/昇腾社区核心资源盘点(文档、工具、课程)

②鲲鹏/昇腾社区积分获取体验(问答官、发博客、训练营开源代码仓任务、产品测评)

③鲲鹏/昇腾社区激励体系(用户贡献可以赚取积分,在积分商城兑换礼品)

l鲲鹏开发者计划入口:https://www.hikunpeng.com/developer-program_2025

鲲鹏积分商城兑奖入口:https://www.hikunpeng.com/developer/rewards

l昇腾开发者计划入口:https://www.hiascend.com/developer-program_2025#floor1

昇腾积分商城兑奖入口:https://www.hiascend.com/developer/rewards

三、征文要求

内容规范:稿件需基于昇腾 / 鲲鹏已发布的官方素材创作,需为原创内容;若需技术答疑或补充素材,可在对应社区素材库提交 Issue。

字数要求:文章字数不少于2000-3000

保密要求通过素材库获取的资料,请勿直接在互联网上传播,避免触发原创版权风险。

稿件篇数:为避免资源集中,每位博主在单个主题方向下的投稿不超过 2 篇上限73

四、征文时间

征文周期:即日起 — 20251230

五、面向人群

  • 优快云 技术博主、开源开发者
  • 昇腾 / 鲲鹏生态技术实践者
  • AI 异构编程、高性能计算、工业软件领域技术爱好者

六、激励方式

  • 粉丝量要求创作CSDN粉丝需在1w以上1w-5w5w-10w
  • 参与征文活动创作者稿件完成后需经优快云审核通过后,在 优快云 博客及博主个人其他平台自主发布,并且在华为昇腾/鲲鹏社区同步发布

粉丝量1w以上全平台阅读量达到5000以上即可获得相应激励

粉丝量1w-5w全平台阅读量达到2w以上即可获得相应激励

粉丝5w-10w全平台阅读量达到3w以上即可获得相应激励

七、参与方式

在 优快云 博客发布征文内容,标题需添加前缀:【昇腾技术征文】/【鲲鹏技术征文】/【昇腾鲲鹏社区攻略】昇腾实战派+ 自定义标题;

发布完成后,将「博客链接 + 投稿主题方向」发送至征文指定邮箱:liulin@youkuaiyun.com

扫描下方二维码加入征文交流群,获取素材资源、答疑及活动最新通知。

、联系方式

征文咨询邮箱:liulin@youkuaiyun.com

华为昇腾素材库链接: https://gitcode.com/invite/link/8791cccc43cb4ee589e8
过期时间: 2025-12-31

### 鲲鹏服务器与昇腾AI加速卡的兼容性及使用方案 #### 兼容性分析 鲲鹏服务器基于华为自主研发的鲲鹏处理器设计,能够提供强大的通用计算能力。昇腾AI加速卡则专注于人工智能领域的训练和推理任务,二者通过软硬件协同优化可以实现高效的AI处理能力[^3]。 具体来说,昇腾AI加速卡可以通过PCIe Gen4 x16接口连接至鲲鹏服务器,并以EP(Endpoint)模式运行作为协处理器。这种架构允许多张昇腾AI加速卡并行扩展,从而满足分布式推理任务的需求[^2]。此外,鲲鹏服务器的操作系统经过适配后,能够支持昇腾AI加速卡所需的驱动程序和开发环境,进一步增强了两者的兼容性和稳定性。 #### 使用方案概述 为了充分发挥鲲鹏服务器与昇腾AI加速卡的能力,建议采用以下技术路径: 1. **软件栈搭建** - 安装适合鲲鹏平台的操作系统版本,例如欧拉OS或其他经认证的支持鲲鹏架构的Linux发行版。 - 调用昇腾AI云服务器所支持的Python接口或MindStudio图形化工具完成模型部署与管理操作[^1]。 2. **框架支持** - 利用TensorFlow、Caffe、MindSpore等主流深度学习框架进行算法开发。这些框架均已被优化以便更好地适应昇腾处理器特性。 3. **网络通信优化** - 结合25Gbps高性能智能网卡以及8×100Gbps RDMA网络构建大规模训练集群,提升数据传输效率和支持更复杂的AI应用场景需求。 4. **编程实践示例** 以下是利用MindSpore框架在配备昇腾AI加速卡的鲲鹏服务器上执行简单神经网络训练的一个代码片段: ```python import numpy as np from mindspore import context, nn, Tensor from mindspore.nn import TrainOneStepCell, WithLossCell context.set_context(mode=context.GRAPH_MODE, device_target="Ascend") class Net(nn.Cell): def __init__(self): super(Net, self).__init__() self.dense = nn.Dense(in_channels=16, out_channels=10) def construct(self, x): return self.dense(x) network = Net() loss_fn = nn.SoftmaxCrossEntropyWithLogits(sparse=True, reduction='mean') optimizer = nn.Momentum(network.trainable_params(), learning_rate=0.01, momentum=0.9) net_with_loss = WithLossCell(network, loss_fn) train_network = TrainOneStepCell(net_with_loss, optimizer) input_data = Tensor(np.random.randn(32, 16).astype(np.float32)) label = Tensor(np.random.randint(0, 10, (32)).astype(np.int32)) for _ in range(10): # 进行十次迭代更新参数 train_network(input_data, label) ``` 上述脚本展示了如何定义一个简单的全连接层并通过梯度下降法对其进行训练的过程。其中`device_target="Ascend"`指定了目标设备为昇腾系列芯片。 #### 维护与发展策略 随着华为持续投入资源完善其围绕鲲鹏与昇腾处理器建立起来的产品生态系统,未来可能会推出更多针对特定行业定制化的解决方案和服务包来简化用户的实施流程并降低总体拥有成本(TCO)[^3]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

优快云资讯

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值