算法移植部署
文章平均质量分 93
阿牛的药铺
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
嵌入式AI部署平台全解析:从Arduino到Jetson的模型部署指南
能力能力能力能力嵌入式平台ArduinoESP32STM32NVIDIA Jetson基础ML轻量级NN实时推理完整DL二、Arduino部署详解1. 可行方案传统机器学习:决策树、SVM等小型算法微型神经网络:TensorFlow Lite Micro(极简模型)自定义逻辑:手工特征提取+简单分类2. 实战案例:手势识别性能数据:优化技巧:Keras/TF模型STM32Cube.AI优化C代码STM32部署2. 工业缺陷检测案例关键参数:优化手段:2. 模型剪枝流程#me原创 2025-08-28 10:20:37 · 1133 阅读 · 0 评论 -
寒武纪MLU全系列模型优化部署核心技术栈与面试宝典
面试时务必携带具体案例 - 如:“我曾将Bert模型部署到MLU270,通过INT8量化和算子融合,时延从35ms降至11ms,吞吐提升3.2倍”。掌握这些,拿下offer如探囊取物!原创 2025-08-23 19:26:51 · 805 阅读 · 0 评论 -
流水线并行优化:从原理到实践的全方位解析
流水线并行是一种模型并行技术,其核心思想是将神经网络模型按层划分为多个阶段(stage),每个阶段部署在不同的计算设备(如GPU)上,通过设备间的数据传输串联起完整的前向和反向计算过程。与数据并行不同,流水线并行通过纵向切割模型而非数据,使得单个设备只需存储和计算模型的一部分,从而突破设备显存限制。表:分布式训练并行技术对比并行类型划分维度通信内容适用场景数据并行(DP)数据批次划分梯度聚合数据量大、模型可单卡放下流水线并行(PP)模型层划分层间激活值和梯度模型过大无法单卡放下。原创 2025-07-12 22:03:53 · 713 阅读 · 0 评论 -
RK3568模型部署全流程详解:从训练到板端推理实战指南
RK3568采用22nm制程工艺,搭载四核Cortex-A55处理器和Mali-G52 GPU,其核心亮点在于内置独立NPU(神经网络处理单元),支持INT8/INT16量化加速,典型功耗仅2W左右。NPU通过专用指令集和内存优化,相比CPU可实现5-10倍的AI推理加速,特别适合实时视频分析、工业质检等场景。关键性能指标CPUNPU:1TOPS算力,支持TensorFlow/MXNet/PyTorch等框架模型内存:支持4GB LPDDR4视频:4K@60fps解码,1080P@100fps编码。原创 2025-07-12 17:46:20 · 984 阅读 · 0 评论 -
军事图像识别技术全解析:类型、方法与FPGA移植挑战(附光学产品实战指南)
军事图像识别是。原创 2025-07-12 16:30:21 · 1274 阅读 · 0 评论 -
FPGA高速接口技术全解析:PCIe/DDR/LVDS原理、对比与应用场景(附光学产品移植实战)
PCIe、DDR、LVDS是FPGA开发的“三大支柱接口”,在光学产品中分别承担“外部通信”“数据缓存”“传感器接入”的核心角色。作为算法移植工程师,需深入理解各接口的。原创 2025-07-12 15:47:48 · 1658 阅读 · 0 评论 -
光类产品核心算法综述:从图像识别到FPGA移植全流程
算法选型能力:根据光谱/红外/可见光特性选择匹配算法硬件映射能力:将CNN卷积转换为并行乘加阵列系统集成能力:协调MIPI/PCIe/LVDS等高速接口与算法模块优化迭代能力:基于FPGA资源报表持续优化瓶颈模块。原创 2025-07-11 17:34:55 · 498 阅读 · 0 评论 -
PyTorch & TensorFlow速成复习:从基础语法到模型部署实战(附FPGA移植衔接)
PyTorch版# 输入:1通道红外图像(1, 256, 256)nn.Conv2d(1, 32, kernel_size=3, padding=1),# 32个3x3卷积核nn.ReLU(),nn.MaxPool2d(2)# 输出(32, 128, 128)nn.ReLU(),nn.MaxPool2d(2)# 输出(64, 64, 64)return x# 输出特征图供后续检测头使用# 测试网络。原创 2025-07-11 17:33:23 · 523 阅读 · 0 评论 -
FPGA小白到项目实战:Verilog+Vivado全流程通关指南(附光学类岗位技能映射)
第一个月:Verilog语法+基础项目(LED控制、按键消抖)每天2小时:语法学习+代码编写周末1天:Vivado工具练习第二个月:图像处理基础+工具链深化第一周:摄像头接口学习第二周:灰度转换项目实现第三周:时序分析与约束优化第四周:项目调试与优化第三个月:算法移植实战+岗位技能补充前两周:Sobel边缘检测项目后两周:学习高速接口(MIPI/LVDS)基础,阅读Zynq手册记住:FPGA开发的核心是**“动手+调试”原创 2025-07-11 17:31:13 · 1933 阅读 · 0 评论 -
RK3568模型移植部署全流程实战指南
通过本教程,您已掌握从模型转换到部署优化的全流程。建议从YOLOv5等成熟模型入手,逐步尝试更复杂的Transformer类模型部署。工具进行量化误差分析。原创 2025-07-11 11:54:02 · 1499 阅读 · 0 评论 -
国产AI芯片算法移植全指南:寒武纪、瑞芯微RK3568与华为NPU实战
当前国产AI芯片已形成三大技术路线:寒武纪的MLU系列、瑞芯微的RKNPU以及华为昇腾NPU。:2025年寒武纪持续优化大模型适配能力,华为昇腾则完善软件平台易用性。选择移植平台时需综合考虑算法复杂度(如YOLOX等检测模型需较高算力)、精度要求(INT8量化可能损失3-5%精度)以及部署环境(边缘端常选RK3568,云端倾向昇腾)。原创 2025-07-11 09:48:54 · 3257 阅读 · 1 评论
分享