- 博客(1027)
- 收藏
- 关注
原创 西安电子科技大学人工智能学院携手昇腾+昇思以千问QwQ-32B&DeepSeek等大模型为抓手,探索智慧教育,智慧科研新方式
西安电子科技大学坚持以教育信息化支撑引领教育现代化,利用现代信息技术推动学校环境构建、资源供给、教学模式、评价改革、培训体系、治理服务等方面创新发展,通过“新环境”“新资源”“新教学”“新评价”“新培训”“新治理”等“六新”建设,探索“人工智能+教育”的新模式、新技术、新方法,努力推动学校事业高质量发展。教育数字化是利用信息技术推动教育创新,促进教育结构重组、流程再造、程序重构,转换教育发展的动力结构,构建更高质量的教育体系的历史进程;以“六新”打造教育教学新生态 推动构建“人工智能+教育”标杆大学。
2025-03-29 16:11:44
541
原创 MindSpore Transformers支持DeepSeek-R1蒸馏全流程
target=https%3A%2F%2Fhuggingface.co%2FQwen%2FQwen2.5-Math-7B-Instruct)下载,并参考Qwen2.5(https://gitee.com/mindspore/mindformers/blob/dev/research/qwen2_5/qwen2_5.md#%E6%A8%A1%E5%9E%8B%E6%9D%83%E9%87%8D%E8%BD%AC%E6%8D%A2)权重转换。然后对生成的数据进行拒绝采样的后处理,筛选出回答正确的高质量数据。
2025-03-29 16:09:51
874
原创 视频生成效果惊艳!昇思率先完成Open-Sora 2.0支持
Open-Sora 2.0是潞晨科技推出的全新开源SOTA视频生成模型,相比传统高性能视频生成模型大幅降低了训练成本。Open-Sora 2.0基于3D自编码器 、3D全注意力机制和MMDiT架构,结合高效的并行训练方案和高压缩比自编码器,显著提升训练效率和推理速度。仓库,本文将要给大家详细介绍,如何基于昇思MindSpore和单机Atlas 800T A2,完整实现Open-Sora 2.0视频生成流程。结合开源图像模型,基于图像生成视频,进一步提升生成效果和多样性。
2025-03-29 16:05:12
443
原创 三象智能基于昇腾及昇思MindSpore,以DeepSeek&QwQ-32B等为基础大模型打造智能工作流升级解决方案
例如,当用户询问“A站到B站的最快路线”时,系统不仅提供换乘方案,还会关联推荐沿线广告商家的优惠活动,日均处理咨询量提升至10万次,响应速度缩短至2秒内。在近期案例中,系统日均拦截风险广告超1.5万条,其中因舆情风险触发的拦截占比达25%。能够实现上述的效果,离不开昇腾与昇思MindSpore的保驾护航,昇腾AI硬件强大的算力以及昇思MindSpore AI框架对大模型性能及设备稳定性的支撑,并且同时支持vLLM 、MindIE等推理引擎,确保三象智能智能工作流高效且稳定运行。
2025-03-29 15:59:39
237
原创 MindSpore混合精度训练源码大揭秘
这就是混合精度(Mixed Precision)的核心思想:**让计算在低精度(如float16)下飞驰,在关键环节(如梯度累积)切回高精度(float32)保命**。MindSpore的混合精度模块就像一位精明的“摸鱼导师”,它通过白名单(该摸鱼的地方)和黑名单(必须正经的地方),教会神经网络何时该“偷懒”,何时该严谨。如果检测到CPU环境(`context.get_context("device_target") == "CPU"`),会强制关闭某些优化,毕竟“小马拉大车”容易翻车。
2025-03-29 15:58:03
649
原创 法本信息携手昇腾&昇思:基于DeepSeek&QwQ-32B等打造企业级AI解决方案新范式,引领行业智能化变革
依托昇腾强大的算力底座、高效的昇思AI框架、DeepSeek&QwQ-32B等国内知名大模型,以及法本信息在垂直领域的场景化落地能力,三方联合打造了覆盖智能编码、知识管理、智能制造、安全生产等领域的全栈式AI解决方案,为企业智能化转型提供技术引擎。作为昇腾AI、华为云核心生态伙伴,法本信息在昇腾、昇思MindSpore、鲲鹏、HiCar、鸿蒙生态、多方面产业保持长期合作,致力于支持昇腾、昇思等生态的产品技术投入,赋能千行百业场景应用和服务创新。基于昇腾AI的知识大脑GPTBrain系统整体架构。
2025-03-29 15:50:22
320
原创 基于 MindSpore 和Deepseek的Agent+RAG问答系统
大语言模型在智能交互、语言理解等方面都展现出了强大能力,然而在实际业务场景中,通用的基础语言大模型往往难以满足特定的业务需求。大模型的知识来源受限于其训练数据,目前主流的大模型,如ChatGPT、文心一言、通义千问等,其训练集主要基于网络公开数据。意味着它们往往难以获取实时、非公开或离线数据中的知识,从而限制了模型在某些专业领域的应用。同时大模型可能面临幻觉问题,由于所有AI模型的底层原理都基于数学概率,大模型的输出实质上是一系列数值运算的结果。
2025-03-29 15:48:23
816
原创 启动报名!第七届·2025 MindSpore量子计算黑客松全国大赛,以赛启智,逐梦量子前沿!
第七届·2025 MindSpore量子计算黑客松全国大赛”火热来袭!热身赛、量子组合优化、量子误差缓解、量子启发算法赛道已发布赛题。无论您是初学小白,还是技术达人,参赛即有收获!诚邀报名参赛,勇攀量子世界的高峰,挑战黑客松年度总冠军,赢取属于你的荣誉和机遇!想要与志同道合的伙伴们一起探讨创新方案?以下任务待认领:(1)针对性量子误差缓解算法 (2)QAOA量子优势的衡量。长按下方二维码加入MindSpore Quantum项目↓。,可跳转至大赛官网可直接报名。回复“量子黑客松”进入交流群。
2025-03-27 16:04:37
315
原创 在昇腾AI处理器上部署MindSpore的环境配置笔记
(注:本文所有配置基于MindSpore 2.2 + CANN 7.0环境验证,实际部署时请核对版本兼容性矩阵)预期输出:包含Ascend设备信息的8x8全8矩阵。
2025-03-21 11:14:19
362
原创 华为昇思MindSpore应用——FCN图像语义分割
图像语义分割是计算机视觉中的一个经典任务,它的目标是为每一个像素分配一个标签,从而实现图像的精细化理解。与传统的图像分类任务不同,语义分割要求不仅识别出物体的种类,还需要准确地定位每个物体的像素级边界。FCN(Fully Convolutional Networks) 是一种经典的语义分割方法。它是通过将传统卷积神经网络(CNN)中的全连接层替换成卷积层来实现像素级的预测。FCN的关键思想是通过逐像素预测分割结果,保留了图像中的空间信息,有效提高了图像分割的精度。
2025-03-21 11:13:08
335
原创 基于MindSpore的Transformer实现
Transformer作为自然语言处理(NLP)和计算机视觉(CV)领域的核心模型架构,已被广泛应用于机器翻译、文本生成、语义理解等任务。MindSpore提供了高效的计算图优化和分布式训练能力。
2025-03-21 11:11:20
417
原创 昇腾+昇思+DeepSeek | 奥看科技携手江苏鲲鹏·昇腾生态创新中心驱动行业全场景跃迁
近年来,数智技术作为数字化与智能化的有机融合体,正在打破行业边界。携手江苏鲲鹏·昇腾生态创新中心,南京奥看信息科技有限公司(以下简称“奥看科技”)以昇腾AI硬件与昇思MindSpore AI框架为引擎,通过视觉AI大模型与DeepSeek语言模型结合,通过多模态赋能企业生产人、机、料、法、环的全量场景,实现场景的自主监测、智能分析、联动处置和精准治理,能够将预警信息及时同步至各工业系统,解决了传统安检及时性差、人力成本高、管理效率低的痛难点,助力工业制造企业降本增效,优化生产流程。
2025-03-21 11:10:07
430
原创 基于昇腾+MindSpore,玩转HunyuanVideo-I2V图生视频!
HunyuanVideo-I2V在HunyuanVideo (T2V)的基础上,将参考图像的潜在特征和高斯噪声进行拼接和融合,作为DiT模型的输入,在每一步去噪的前后进行首帧图像潜在特征的替换。用户只需要提供一张图片,简要描述要生成的视频内容,例如动作描述,镜头位置等等,HunyuanVideo-I2V就可以让图片动起来,生成高清连贯的视频,最高支持720P 5s。可以看出,i2v_stability 为True时,会进行参考图像和随机噪声的潜在混合,以保持对参考图像的一致性。
2025-03-18 11:14:40
345
原创 昇思五日谈 | 5场直播,深度解析昇思支持DeepSeek训推全流程核心技术
昇思MindSpore开源社区即将迎来开源五周年,五载开源路,初心未改;万千开发者,同行致远!为回馈开发者长期以来的支持与热爱,我们以一场硬核技术盛宴回馈社区——「昇思五日谈」专题直播重磅上线!5场直播带你揭秘昇思MindSpore大模型训练与推理关键技术,助力开发者抢占AI技术高地!
2025-03-18 11:12:49
283
原创 MindSpore社区活动:基于MindSpore框架实现PWCNet光流估计
体验昇思MindSpore官网中的“:基于MindSpore框架实现PWCNet光流估计”,并记录体验过程。
2025-03-17 16:21:47
205
原创 mindspore源码精读之权重加载实现全解析:从Checkpoint到神经网络的桥梁
在不同深度学习框架之间迁移模型时,权重加载就像一个翻译官,需要将不同框架的参数表示进行转换。例如,在 PyTorch 中,BatchNorm层的均值统计量存储为,而在 MindSpore 中则是。使用 MindSpore 2.4.0 的函数时,如果不进行正确的映射,就会导致加载失败。# 假设这是从 PyTorch 转换过来的参数名映射在实际的医疗图像识别模型迁移项目中,开发团队手动编写了数百条名称映射规则,耗时数周才完成模型的迁移。这充分说明了模型迁移时权重加载的复杂性。
2025-03-14 17:02:28
690
原创 MindSpore源码精读之ckpt及safetensors权重保存流程
Protocol Buffers(简称 Protobuf)是由 Google 开发的一种与语言无关、平台无关、可扩展的序列化结构数据的方法。它允许你定义数据的结构,然后使用特殊生成的源代码轻松地在各种数据流中使用各种语言对结构化数据进行序列化和反序列化。Protobuf 的工作流程主要分为以下几个步骤:首先,使用.proto文件定义数据结构,这类似于定义一个类或结构体。在这个例子中,我们定义了一个名为Personname(字符串类型)、age(32 位整数类型)和email(字符串类型)。
2025-03-14 17:00:37
922
原创 倍特威视基于昇腾昇思,以Deepseek为基础大模型打造异常检测及预测解决方案
尤其是在面对工业场景隐患排查任务时,即使模型输入的prompt长度达到上万,昇腾配合MindIE推理引擎仍能保持出色的性能表现,确保了模型的稳定性和高效性。" 通过倍特威视智能算法对2000余路摄像头的实时解析,管理覆盖率从人工巡检的20%提升至95%,安全员工作重心转向高风险作业的深度管控。倍特威视表示:"大模型就像24小时在线的安全专家,既能抓现行违规,更能教预防之道。通过部署AI视频风险识别系统,我们的安全巡检效率提升了10倍,管理范围从重点区域扩展到全厂覆盖,真正实现了风险管控关口前移。
2025-03-14 16:58:08
345
原创 携手昇思,玲珑大模型一体机部署DeepSeek实践
作为上海首个自主创新“软硬协同”AI示范案例,珑京科技从底层算力建设到大模型业务实现全自主创新,高效部署多种模型,满足企业级用户多样AI需求,打破局限,让AI触手可及!
2025-03-14 16:57:23
265
原创 昇思框架×昇腾开发板:DeepSeek蒸馏版与多模态模型部署全流程实践
昇思MindSpore联合香橙派,助力开发者创新AI算法,加速落地应用,未来昇思MindSpore将联合昇腾社区与香橙派,提供更丰富完善的模型案例与课程,欢迎感兴趣的开发者一同参与,基于昇思MindSpore+香橙派AIpro构建昇腾软硬件协同的模型和应用。昇思MindSpore布道师对MindSpore在香橙派开发板上的能力支持做了详细的说明,目前昇思MindSpore AI框架已实现在香橙派AIpro开发板预置,并在官方网站上线开发指导教程,通过软硬结合,使能开箱即用模型,并。授课讲师现场指导开发者。
2025-03-14 16:56:39
644
原创 「她力量·代码之外」:当技术温度遇见跨界创造力
"社区的教程文档内容详细且逻辑清晰,让我从‘看不懂’到‘做得出’",她坦言,与传统极客的“单打独斗”不同,自己更依赖社区的力量。她们的故事,既是科技女性的成长缩影,也是开源精神的最佳诠释。”她拒绝将“主流赛道”与“垂直领域”对立,而是以MindSpore为桥梁,在量子计算与AI的交叉领域深耕——社区提供的科学计算套件,让她能同时涉猎物理、化学等多领域工具,实现真正的跨界创新。而在这片充满活力的领域中,越来越多的女性开发者以独特的视角与韧性,打破传统极客的刻板印象,用代码书写属于自己的篇章。
2025-03-12 10:07:58
511
原创 携手北京大学,MindSpore+openEuler打造支持vLLM的DeepSeek全栈开源推理方案
计算图的执行需要支持动态shape以满足推理场景输入输出序列长度以及batch size的动态变化,相比于静态shape的整图下沉,动态shape的计算图执行需要每个iteration在Host侧重新执执行shape推导以及申请显存等操作,为了避免Host成为瓶颈,MindSpore通过Shape推导和显存申请、算子Tiling数据计算以及算子下发三级流水优化,实现Host计算和Device计算的掩盖。华为公司的栾建海(左四),邓叶鹏(左三),李强(左二),李佳明(左一)
2025-03-12 10:07:10
907
原创 星舟志屹基于昇思MindSpore AI框架打造星舟大模型DeepSeek版,加速能源与旅游业智能化升级
例如,在知识蒸馏技术落地时,昇腾的异构计算架构支持轻量化模型与大型预训练模型的同步高效运行,结合昇思的自动并行编译能力,使知识迁移效率提升50%以上,确保能源边缘设备在低功耗环境下仍能实现实时推理。而在处理能源领域PB级多模态数据时,昇腾AI硬件与昇思的分布式并行技术深度融合,使模型的数据清洗与特征提取速度提升3倍,为海量数据库理解提供了底层保障。星舟志屹计划与昇腾+昇思生态深度绑定,基于昇思科学计算套件拓展模型在具身智能+大模型的技术边界,进一步夯实国产工业级大模型的技术壁垒,为智慧能源注入更强动能。
2025-03-12 10:04:08
723
原创 基于昇思实现古画修复?「昇思文旅SIG创新技术学习交流会」火热报名中
多模态修复利用文本等专家经验信息,通过潜在扩散模型的微调,构造文本提示下的古画修复与编辑模型,实现了可解释可参与的古画修复与重新创作。通过基于边缘先验信息的修复、基于双编码器和上下文信息的修复、大面积破损修复、文本引导的多模态修复等智能方法,为古画数字化修复提供了多维度的智能解决方案。本次会议面向所有对AI文旅感兴趣的你,希望通过学习昇思MindSpore的最新技术路线与基于昇思的DeepSeek实践,学习AI文旅的有趣案例与实践,共同孵化基于昇思的文旅创新应用。唐·柳公权《玄秘塔碑》修复结果(局部)
2025-03-12 10:03:07
264
原创 昇思MindSpore资料满意度调查问卷—3月
昇思MindSpore为了更好的服务开发者,特发起了本次资料调查问卷活动,以期获得满意度评分和使用需求和意见/建议,作为后续的优化重点,提升开发者们的体验感。点击下方调查问卷链接或扫码参与本次昇思MindSpore资料满意度调查问卷活动,丰富奖品等您来选,亲爱的开发者们快快行动啦~1、我们将会从有效参加本次问卷调查的小伙伴中抽取50位,做为本次的获奖用户;
2025-03-11 09:56:26
318
原创 征服 MindSpore(二): Tensor 失忆了,请别让他被坏设备拐走了!
那么,有没有形式化的表述呢?对于设备矩阵 [m1,m2,m3][m1,m2,m3], tensor 的索引 [k1,k2,k3][k1,k2,k3], 对于张量映射对应的高维 tensor,其对应的索引为 k1,k2k1,k2, 则其对应的 rank 索引为 k1∗(m2∗m3)+k2∗m3+[0...k3]k1∗(m2∗m3)+k2∗m3+[0...k3]。,X的分布是(2,4),他的坐标就是(1,1),所以我们需要找到 X_map 为 (1,1)的格子,给他填上 X-5。
2025-03-07 16:40:36
304
原创 征服 MindSpore(一): IR 图再多也吃得下!
本文中提到的人物对话【纯属虚构】的,如有雷同,纯属巧合,请【勿对号入座】。特邀嘉宾:首座常驻嘉宾:xxx、xxx。观众。。。
2025-03-07 16:39:47
1025
原创 昇腾910精度对齐过程思路及过程
硬件环境(Ascend/GPU/CPU): Ascend 910MindSpore版本: mindspore=2.1执行模式(PyNative/ Graph):GraphPython版本: Python=3.8.15操作系统平台: linux。
2025-03-07 16:37:38
395
原创 基于昇腾910的loss差异分析
硬件环境(Ascend/GPU/CPU): Ascend 910MindSpore版本: mindspore=2.1执行模式(PyNative/ Graph):GraphPython版本: Python=3.8.15操作系统平台: linux。
2025-03-07 16:36:44
196
原创 基于 MindSpore 训练大语言模型 - 从零开始的实践指南
训练日志将保存在 output/logs 目录下。模型 checkpoint 会定期保存在 output/ckpts 目录。训练初期 loss 波动较大属于正常现象,建议训练超过1000步再评估效果。如遇到命令行换行符问题,可尝试去除反斜杠后在单行执行。确保系统内存充足,推荐预留50%以上空闲内存。存储 >= 1TB NVMe SSD。预训练语料库(WikiText-2)固件与驱动版本 24.1.RC3。2. 混合专家系统(MoE)配置。内存 >= 512GB。3. 分布式训练配置。
2025-03-07 16:35:15
352
原创 MindSpore源码精读之从参数保存加载到mindspore的python与c++的链接
Python 的语法简洁,支持自动内存管理和动态类型,开发速度快,且提供了丰富的预定义模块和工具(如 `mindspore.nn`、`mindspore.ops`),便于快速实现模型定义、训练和推理任务。总结来说,Python 侧适合快速开发和实验,而 C++ 侧适合高性能计算和底层优化,两者相辅相成,共同支撑 MindSpore 的全场景 AI 计算能力。MindSpore使用pybind11连接python侧的接口和c++侧的接口,兼顾python的简单便捷和c++的高性能。
2025-03-07 16:30:28
751
原创 鹏城实验室发布基于昇思框架、昇腾硬件的强化学习训练框架GRPO-Training-Suite
与我们以往开发的单模型训练代码相比,GRPO强化学习训练流程涉及策略模型与参考模型,通过策略模型生成数据,利用参考模型和奖励函数计算Loss,然后进行策略模型的训练。这个过程需要模型在推理和训练状态间的频繁切换,并涉及参考模型和策略模型推理、训练三份权重,对训练性能和显存管理提出了更高的要求,对于强化学习开发者来说,快速完成算法开发和模型训练是个不小的挑战。因此需要针对推理和训练模型分别进行切分。通过异构内存Swap技术,按需加载模型至显存,避免训练和推理的权重同时存在,支持更大规模模型的训练任务。
2025-03-07 16:28:52
824
原创 视频生成SOTA模型推理开箱即用!MindSpore支持Wan2.1
MindSpore快速对Wan2.1进行适配,并将其开源至MindSpore ONE仓库,结合昇腾硬件,为开发者提供高效体验。在AI视频生成领域,Wan2.1作为最新的视觉生成模型,能够根据文本、图像或其他控制信号生成视频,以其卓越表现备受关注。可自定义prompt,生成480P个性化视频,通过调小sample_guide_scale参数增强视频画面质量,或者调大该参数以增强视频-文本匹配程度。支持1.3B和14B模型,分辨率可选480P或720P。支持14B模型,分辨率可选480P或720P。
2025-03-07 16:23:48
379
原创 加速DeepSeek训练性能调优,揭秘昇思MindSpore大模型自动流水负载均衡技术
假设有一个stage数为pp的流水线,每个stage的内存值为M,stage中的layer数为li,重计算层数为ri,i为stage id。从图中观察1F1B的流水执行中,可以看到瓶颈是stage16的正反向时间,其余的stage不得不等待stage16的计算结束,因此可以看出在stable阶段产生了不小的bubble,而在cooldown阶段,因为前面stage的反向已经结束,产生了非常明显的巨大的bubble,最终real bubble值为1.45,很明显该平均切分策略性能较差。
2025-03-07 16:20:22
732
原创 易库智能携手昇思+昇腾,结合DeepSeek打造大模型知识赋能平台
在数字经济高速发展的今天,知识数据已成为企业发展的"战略资源",如何通过AI技术实现知识的高效管理与价值释放,是各行业数字化转型的核心命题。为解决以上问题,易库智能积极与昇腾+昇思对接,并在2025年3月完成自主研发的知识大模型产品对国产大模型DeepSeek模型的适配,为企业实现更大的系统吞吐、用户并发以及更灵活高效的部署打下了坚实的基础,进一步推动了自主创新底座搭载国产模型的产业发展,为企业AI知识体系建设注入强劲动能,全面加速人工智能技术产业化进程。
2025-03-07 16:19:30
365
原创 基于 MindSpore 训练大语言模型 - 从零开始的实践指南
训练日志将保存在 output/logs 目录下。模型 checkpoint 会定期保存在 output/ckpts 目录。训练初期 loss 波动较大属于正常现象,建议训练超过1000步再评估效果。如遇到命令行换行符问题,可尝试去除反斜杠后在单行执行。确保系统内存充足,推荐预留50%以上空闲内存。存储 >= 1TB NVMe SSD。预训练语料库(WikiText-2)固件与驱动版本 24.1.RC3。2. 混合专家系统(MoE)配置。内存 >= 512GB。3. 分布式训练配置。
2025-02-28 16:58:33
389
原创 重生之大腿带我征服 MindSpore(一): IR 图再多也吃得下!
图模式的好处之一就是能够在编译的时候,获取到完整的图信息,以便我们根据整图结构进行更好地优化,而在动态图的时候,就无法拿到这些信息。例如,torch 需要打印数据的时候,可以直接 print 对应的数据,而 MindSpore 在这方面支持还比较有限(据可靠消息,在最新的 2.3 版本上已经支持了)。大概是这样的:静态图能够获得图的全局信息,包含节点的顺序和数据类型,可以有针对性的进行优化,这里的优化可以是算子执行顺序的调整、内存优化等,最终的目的都是为了更快的执行速度。【问题一】:首座,您好,我是小来。
2025-02-28 16:52:56
796
原创 MindSpore源码精读之ckpt及safetensors权重保存流程
Protocol Buffers(简称 Protobuf)是由 Google 开发的一种与语言无关、平台无关、可扩展的序列化结构数据的方法。它允许你定义数据的结构,然后使用特殊生成的源代码轻松地在各种数据流中使用各种语言对结构化数据进行序列化和反序列化。Protobuf 的工作流程主要分为以下几个步骤:首先,使用.proto文件定义数据结构,这类似于定义一个类或结构体。复制在这个例子中,我们定义了一个名为Personname(字符串类型)、age(32 位整数类型)和email(字符串类型)。
2025-02-28 16:49:10
942
原创 MindSpore训练DeepSeek-V3轻量版实战指南
A:通过VPN或镜像站点(如ModelScope)代理下载。A:流水线并行下仅最后一张卡显示loss,检查。参数并确认驱动挂载路径。
2025-02-28 16:47:54
400
原创 昇思MindSpore亮相2025年全球开发者先锋大会(2025 GDC):大模型首选AI框架
作为昇思MindSpore开源社区持续打造生态繁荣的主阵地持续开展昇思技术行,昇思MSG城市行,SIG论坛等活动,以生态赋能,激励学术创新、产业创新与应用创新,携手开发者,共同打造昇思开源开放社区,不断助力开发者创新与应用。本次大会以“模塑全球 无限可能”为主题,重点引导大模型企业赋能垂类应用落地,聚焦具身智能、自动驾驶、科学智能、在线新经济、智能终端等关键领域,促进开发者资源对接、产业融合,吸引全球100多家开发者社区及数万名开发者参与。提供高阶API,动静态图脚本代码免修改,平滑切换。
2025-02-28 16:47:09
159
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人