- 博客(139)
- 收藏
- 关注

原创 国产之光DeepSeek架构理解与应用分析
在机械电子工程产业中,人工智能的加持可用于故障诊断、生产流程优化、产品设计辅助等方面,比如通过分析设备数据预测故障,或优化生产线调度提高效率,提高生成效率、降低人员作业的安全风险。对于人工智能大模型当下的发展阶段,如何落地,并在横向领域发挥出作用成为越来越被关注的话题,笔者的朋友提出了几个问题:DeepSeek的用处除了在信息库里提取提问者需要的有效信息外还有别的功能吗?在车身焊接环节,基于深度学习的视觉系统(如YOLOv5)检测焊点质量,误检率低于0.5%,较传统光学检测效率提升5倍。
2025-01-31 21:11:30
24069
61
原创 【MindSpore】使用ms框架进行深度学习模型训练及理解函数式自动微分
mindspore是华为自研的国产AI框架,训推一体,支持动态图、静态图,全场景适用,有着不错的生态,本文参考官网教程,在华为云上的modelarts租赁实例进行实验
2025-05-20 10:45:56
759
原创 【MindSpore】用mindspore实现简单的深度学习模型
mindspore是华为自研的国产AI框架,训推一体,支持动态图、静态图,全场景适用,有着不错的生态,本文参考官网教程,在华为云上的modelarts租赁实例进行实验
2025-05-20 10:34:22
861
原创 【从基础到模型网络】深度学习-语义分割-ROI
在语义分割中,ROI(Region of Interest,感兴趣区域)是图像中需要重点关注的部分。其作用包括:提高效率,减少高分辨率图像的计算量;增强分割精度,聚焦关键语义信息;减少背景干扰,提升模型性能;适应特定场景需求,如医学图像中的肿瘤检测或自动驾驶中的行人检测。ROI 提取可通过手动标注、目标检测算法或注意力机制实现,是优化语义分割任务的重要手段。
2025-05-18 13:05:53
946
原创 【从基础到模型网络】深度学习-语义分割-基础
语义分割在深度学习与人工智能领域占据重要地位。它是计算机视觉的核心任务之一,能够将图像像素级地划分为不同语义类别,为理解图像内容提供关键支持。在自动驾驶中,可精准识别道路、车辆、行人等元素,保障行车安全;在医学影像分析中,能准确分割器官和病变区域,辅助疾病诊断。此外,它还广泛应用于机器人视觉、卫星图像分析等领域,推动人工智能向更精准、更智能的方向发展,是实现智能视觉感知的关键技术。
2025-05-18 13:01:20
907
原创 【CV2】计算机视觉的图像处理库
cv2.add()输入图像尺寸和通道数必须相同,使用cv2.resize来实现,cv2.resize中的dsize参数是指目标图像的大小,其格式应为 (宽度, 高度)途径:生成一张`掩膜`,把图像中需要去掉(或者说,变成黑色)的像素点标记为0、把图像中需要保留的像素点标记为`“1”``cv2.add`用于两个图像的逐像素加法操作,或者一个图像与一个标量的加法操作,与直接使用 + 运算符不同,它提供了。- 其余区域的像素都与`(0, 0, 0)`做`and`操作,像素值变成`(0, 0, 0)`
2025-05-11 22:49:43
754
1
原创 【Diffusion】在华为云ModelArts上运行MindSpore扩散模型教程
最近对生成模型非常感兴趣,尤其是扩散模型(Diffusion Models),它在图像生成等领域取得了显著成果。为了深入理解扩散模型的原理和实现,我选择在华为云的ModelArts平台上运行MindSpore官方提供的扩散模型教程。希望通过这次实践,能够掌握扩散模型的基本架构、训练过程以及生成图像的原理。
2025-05-11 22:43:08
1381
原创 MindSpore框架学习项目-ResNet药物分类-模型优化
通过这个用ResNet50进行对中药材的种类及品阶进行12分类的项目,学习mindspore AI框架的使用和深度学习任务的一般流程,熟悉如何通过深度学习的方式来拟合数据,处理生产生活中的问题,为AI赋能的时代贡献点滴实践。
2025-05-10 10:56:29
669
原创 MindSpore框架学习项目-ResNet药物分类-模型评估
通过这个用ResNet50进行对中药材的种类及品阶进行12分类的项目,学习mindspore AI框架的使用和深度学习任务的一般流程,熟悉如何通过深度学习的方式来拟合数据,处理生产生活中的问题,为AI赋能的时代贡献点滴实践。
2025-05-10 10:53:53
1236
原创 MindSpore框架学习项目-ResNet药物分类-模型训练
通过这个用ResNet50进行对中药材的种类及品阶进行12分类的项目,学习mindspore AI框架的使用和深度学习任务的一般流程,熟悉如何通过深度学习的方式来拟合数据,处理生产生活中的问题,为AI赋能的时代贡献点滴实践。
2025-05-10 10:35:34
1236
原创 MindSpore框架学习项目-ResNet药物分类-构建模型
通过这个用ResNet50进行对中药材的种类及品阶进行12分类的项目,学习mindspore AI框架的使用和深度学习任务的一般流程,熟悉如何通过深度学习的方式来拟合数据,处理生产生活中的问题,为AI赋能的时代贡献点滴实践。
2025-05-09 23:41:11
1104
原创 MindSpore框架学习项目-ResNet药物分类-数据增强
通过这个用ResNet50进行对中药材的种类及品阶进行12分类的项目,学习mindspore AI框架的使用和深度学习任务的一般流程,熟悉如何通过深度学习的方式来拟合数据,处理生产生活中的问题,为AI赋能的时代贡献点滴实践。
2025-05-09 23:35:56
1759
原创 强化学习的一些概念
微调完成后,在推理阶段,可以选择动态加载 LoRA 适配器(即使用原始权重矩阵W加上更新后的Delta W = AB进行计算 ),或者将低秩矩阵与原始权重矩阵合并W'=W + AB',合并后的模型推理速度与原始模型一致,且只需要保存合并后的权重。专用性强:适用于 单一任务或固定场景。假设原始模型中有一个权重矩阵W(维度为d×k ),在 LoRA 中,对权重矩阵的更新量Delta W进行分解,将其表示为两个低秩矩阵A(维度为d×r)和B(维度为r×k )的乘积,即Delta W = AB ,其中。
2025-05-04 22:41:08
907
1
原创 transfomer网络构建
对自注意力层的输出应用交叉注意力层和第二个残差连接:self.residual_connections[1](x, lambda x: self.cross_attention_block(x, encoder_output, encoder_output, src_mask)),交叉注意力层中,查询来自解码器当前层的输入,键和值来自编码器的输出,src_mask 用于屏蔽源序列中填充位置的信息。decode 方法:对目标序列进行嵌入和位置编码:tgt = self.tgt_embed(tgt);
2025-05-04 22:37:03
1059
2
原创 深度学习语音识别
Conformer:在Transformer中嵌入卷积模块(如Convolution Module),利用CNN提取局部声学特征,同时保留自注意力的全局建模能力。技术演进主线:从CTC的序列对齐,到注意力机制的上下文建模,再到Conformer的全局-局部特征融合,语音识别逐步向高效、高精度、低延迟方向发展。RNN-T:在CTC基础上引入预测网络(语言模型)和联合网络,允许每帧生成多个符号,支持实时流式识别(如语音助手)。CTC:早期端到端模型的代表,解决了输入输出序列对齐问题,但缺乏语言模型支持。
2025-04-19 10:46:11
533
1
原创 国产之光DeepSeek架构理解与应用分析04
DeepSeek-V3通过多Token预测、免负载均衡MOE、高效注意力缓存等核心技术,实现了训练效率、推理速度与生成质量的全面提升。其创新点不仅体现在算法设计上,更通过工程优化(如并行化、缓存策略)解决了大规模模型部署的实际瓶颈,为工业级应用提供了新的标杆。
2025-04-19 10:40:57
1157
1
原创 国产之光DeepSeek架构理解与应用分析03
DeepSeek通过其创新的架构设计,为人工智能的发展贡献了显著价值。首先,它引入了多Token预测机制,提高了模型在处理复杂数据时的效率和准确性。其次,DeepSeek的MOE架构无需负载均衡,简化了模型训练流程,降低了计算资源的消耗。最后,通过结合KV Cache的MLA技术,DeepSeek显著提升了推理速度,使得AI应用在实时性要求高的场景下更具可行性。这些创新不仅推动了AI技术的进步,也为行业提供了新的解决方案和思路。
2025-04-18 11:17:44
867
1
原创 deepseek的transformer模块和旋转位置编码
DeepSeek通过其创新的架构设计,为人工智能的发展贡献了显著价值。首先,它引入了多Token预测机制,提高了模型在处理复杂数据时的效率和准确性。其次,DeepSeek的MOE架构无需负载均衡,简化了模型训练流程,降低了计算资源的消耗。最后,通过结合KV Cache的MLA技术,DeepSeek显著提升了推理速度,使得AI应用在实时性要求高的场景下更具可行性。这些创新不仅推动了AI技术的进步,也为行业提供了新的解决方案和思路。
2025-04-18 11:15:11
889
1
原创 国产之光DeepSeek架构理解与应用分析02
DeepSeek通过其创新的架构设计,为人工智能的发展贡献了显著价值。首先,它引入了多Token预测机制,提高了模型在处理复杂数据时的效率和准确性。其次,DeepSeek的MOE架构无需负载均衡,简化了模型训练流程,降低了计算资源的消耗。最后,通过结合KV Cache的MLA技术,DeepSeek显著提升了推理速度,使得AI应用在实时性要求高的场景下更具可行性。这些创新不仅推动了AI技术的进步,也为行业提供了新的解决方案和思路。
2025-04-18 11:10:29
1492
1
原创 【NLP解析】多头注意力+掩码机制+位置编码:Transformer三大核心技术详解
Transformer模型为何能横扫NLP领域?关键在于多头注意力、掩码机制和位置编码这三大核心技术。本文用通俗语言+生活案例,带你理解它们的原理与设计逻辑
2025-04-12 14:45:07
1781
1
原创 【NLP必知必会】注意力机制与自注意力机制详解:从原理到优缺点对比
在自然语言处理(NLP)中,注意力机制(Attention Mechanism)和自注意力机制(Self-Attention)是两大“神器”,它们让模型像人类一样动态关注重点信息。本文通过生动案例和通俗语言,带你彻底搞懂它们的原理、计算流程,以及与RNN的对比!
2025-04-12 11:52:43
785
1
原创 从Attention机制到Transformer02
在当今数字化浪潮中,自然语言处理(NLP)携手大模型,正引领着人工智能的全新变革。NLP 作为理解与生成人类语言的核心技术,正借助大模型的强大算力与海量数据,实现质的飞跃。从精准翻译到智能创作,从复杂问答到情感分析,它们正重塑人机交互的未来。本专栏将聚焦于 NLP 与大模型的前沿动态、技术剖析及实战应用,带你领略这一领域的无限魅力与潜力,共同见证语言智能的蓬勃发展
2025-04-11 11:37:56
498
1
原创 从Attention机制到Transformer
在当今数字化浪潮中,自然语言处理(NLP)携手大模型,正引领着人工智能的全新变革。NLP 作为理解与生成人类语言的核心技术,正借助大模型的强大算力与海量数据,实现质的飞跃。从精准翻译到智能创作,从复杂问答到情感分析,它们正重塑人机交互的未来。本专栏将聚焦于 NLP 与大模型的前沿动态、技术剖析及实战应用,带你领略这一领域的无限魅力与潜力,共同见证语言智能的蓬勃发展。
2025-04-11 11:35:48
782
1
原创 基于MCP协议调用的大模型agent开发04
MCP(Model Context Protocol,模型上下文协议)是由Anthropic公司提出的一种开源协议,旨在让AI模型能够无缝连接外部工具和资源,就像一把“万能钥匙”,打通了AI与现实世界的交互通道。MCP发布于2024年11月,但起初并未引起太多关注,随着今年智能体(Agent)技术的爆发式发展,MCP逐渐成为开发者关注的焦点。今年2月,Cursor宣布支持MCP功能,进一步推动了这一协议的普及。
2025-04-10 21:30:01
707
原创 基于MCP协议调用的大模型agent开发03
MCP(Model Context Protocol,模型上下文协议)是由Anthropic公司提出的一种开源协议,旨在让AI模型能够无缝连接外部工具和资源,就像一把“万能钥匙”,打通了AI与现实世界的交互通道。MCP发布于2024年11月,但起初并未引起太多关注,随着今年智能体(Agent)技术的爆发式发展,MCP逐渐成为开发者关注的焦点。今年2月,Cursor宣布支持MCP功能,进一步推动了这一协议的普及。
2025-04-10 21:21:12
787
原创 基于MCP协议调用的大模型agent开发02
MCP(Model Context Protocol,模型上下文协议)是一种开放协议,旨在标准化AI应用与大语言模型(LLM)之间的连接方式,为AI应用提供了一个统一、灵活的接入方式。
2025-04-09 15:59:05
1203
3
原创 基于MCP协议调用的大模型agent开发01
MCP(Model Context Protocol,模型上下文协议)是一种开放协议,旨在标准化AI应用与大语言模型(LLM)之间的连接方式,为AI应用提供了一个统一、灵活的接入方式。
2025-04-09 15:57:09
1475
1
原创 操作系统、虚拟化技术与云原生及云原生AI简述
操作系统作为基础,直接管理计算机硬件与软件资源。虚拟化技术的出现,打破了物理设备的限制,通过资源抽象实现了多租户共享,为云计算的发展奠定了基础。云原生则借助容器、Kubernetes 等技术,构建起动态、弹性的分布式系统,加速了应用的开发与部署。而云原生 AI 将云原生技术与人工智能深度融合,既发挥了云原生在资源管理、部署等方面的优势,又借助 AI 提升了云原生系统的智能化水平,在互联网、金融、医疗等多个领域展现出广阔的应用前景。
2025-04-04 12:38:52
1182
1
原创 爬虫学习-爬取古诗
唐诗作为中国古典文学的巅峰之作,现存五万余首诗歌蕴含着丰富的历史文化信息。传统的人工整理方式效率低下,难以应对大规模文本分析需求。本项目通过构建自动化爬虫系统,实现对古诗数据的高效采集与多维度分析,为文学研究、文化传播提供数据支持。
2025-03-28 10:44:41
1558
原创 大模型微调-lora微调
在传统的模型微调中,尤其是大型预训练模型,对所有参数进行更新需要巨大的计算资源和时间成本。而 LoRA 的思路是冻结预训练模型的原始权重,不直接对其进行更新,而是在模型的某些层(常见于 Transformer 模型的自注意力层和前馈网络层 )中引入低秩矩阵来实现微调。
2025-03-26 16:37:57
994
原创 强化学习与神经网络结合(以 DQN 展开)
强化学习(Reinforcement Learning, RL)是机器学习的一个分支,旨在让智能体(Agent)通过与环境的交互学习最优策略,以最大化长期累积奖励。其核心思想是 “试错 - 反馈”,智能体在环境中通过不断尝试动作,根据环境反馈的奖励调整行为,最终学会在不同状态下选择最优动作。
2025-03-26 16:15:45
1195
原创 将云上的开发代码上传到gitee
现在,您的本地仓库已经更新,包含了 test 文件夹及其内容。接下来,您需要将这些更改推送到 Gitee 上的远程仓库,以便其他人也能看到这些更新。假设我的远程仓库在云实例上的文件夹叫zhonyiyaoclassify,cd到这个文件下,执行git add .可以将所有改动进行同步。#3.上传代码到Gitee 将代码文件复制或移动到克隆下来的Gitee仓库文件夹中。#2.克隆仓库到本地 用Git命令将Gitee上的仓库克隆到本地机器上。已经成功推送到了 Gitee 上的远程仓库。#1.创建Gitee仓库。
2025-03-23 21:23:14
623
1
原创 强化学习的常用策略浅析
强化学习是ai agent开发的主要原理,智能体通过于环境的交互学习一些策略,作为指导工作的依据,本篇浅析常用的算法:DDPG、DPPO、simply_PPO、discrete_DPPO
2025-03-23 21:15:56
976
原创 爬虫入门re+bs4
在信息爆炸的时代,互联网已成为数据获取的核心渠道。从学术研究到商业分析,从新闻监控到用户行为洞察,数据的价值日益凸显。而网络爬虫(Web Crawler)作为自动化获取网络数据的核心技术,正扮演着越来越重要的角色。本案例将通过一个完整的 Python 爬虫案例,构建高效、可靠的爬虫系统,实现对中文日报网站内容的自动化抓取与结构化存储。
2025-03-19 17:35:01
2201
原创 强化学习的一些概念
强化学习(Reinforcement Learning, RL)是机器学习的一个分支,旨在让智能体(Agent)通过与环境的交互学习最优策略,以最大化长期累积奖励。其核心思想是 “试错 - 反馈”,智能体在环境中通过不断尝试动作,根据环境反馈的奖励调整行为,最终学会在不同状态下选择最优动作。
2025-03-16 23:44:43
1417
1
原创 实践-给图片右下角加opencv-logo
mask1与roi进行按位与,fg1 = cv2.bitwise_and()mask2与logo进行按位与,fg2 = cv2.bitwise_and。使用OTSU二值化方法进行二值化ret, mask1 =通过按位与获得只有大图背景而logo前景挖空的局部图。只对lena脸部应用密钥进行解密(逻辑异或操作)使用掩码对lena图像的脸部进行打码、解码。通过二值化获取抛弃logo前景的掩码图。通过二值化获取保留logo前景的掩码图。获得只有logo前景而背景挖空的局部图。进行二值化ret, mask2 =
2025-03-16 19:36:25
483
2
美国加州房价预测与分析的机器学习项目
2024-12-24
关于西雅图(King County)房价数据的分析项目
2024-12-24
relation-GDP-life - GDP与幸福感指数关系 数据分析项目
2024-12-24
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人