算能平台边缘端部署(实践)
文章平均质量分 89
针对算能平台边缘端部署
浩瀚之水_csdn
路漫漫其修远兮,吾将上下而求索,立刻行动,坚持,努立
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【算能】bm_image_alloc_contiguous_mem(_heap_mask) 和 bm_image_attach_contiguous_mem区别
在算能(Sophgo)的 BMCV 库中,bm_image_alloc_contiguous_mem、bm_image_alloc_contiguous_mem_heap_mask 和 bm_image_attach_contiguous_mem 均是用于管理 bm_image 内存的核心接口,但其功能、控制粒度和应用场景存在显著差异。原创 2025-05-21 14:46:50 · 78 阅读 · 0 评论 -
【算能】BMCV枚举bm_image_data_format_ext详解
bm_image_data_format_ext 是算能(Sophgo)BMCV(BITMAIN Computer Vision Library) 中用于定义图像数据存储格式与数据类型的枚举类型,直接关联 TPU 硬件加速的图像处理逻辑。原创 2025-05-18 07:20:57 · 90 阅读 · 0 评论 -
【算能】BMCV结构体bmcv_convert_to_attr详解
bmcv_convert_to_attr 是算能(Sophgo)BMCV(BITMAIN Computer Vision Library) 中用于配置图像格式转换参数的核心结构体。它定义了如何将输入的 bm_image(TPU 图像对象)转换为目标格式、数据类型和内存布局,是调用 bmcv_image_convert_to 等图像处理接口的关键参数。原创 2025-05-17 05:02:34 · 103 阅读 · 0 评论 -
【算能】bmodel 文件功能模块标识
在算能(Sophgo)的 .bmodel 文件(编译后的 TPU 模型文件)中,功能模块标识是模型内部对独立计算单元或子网络结构的命名与分类机制。这些标识通过 bmrt_get_network_names 等接口对外暴露,是模型模块化设计的核心体现。原创 2025-05-15 05:42:44 · 230 阅读 · 0 评论 -
【算能】BMCV 库中bm_tensor_t 结构体详解
bm_tensor_t 是算能(Sophgo)BMRuntime 和 BMCV 库中用于表示 多维张量数据 的核心结构体,专为 TPU 硬件加速设计。它封装了张量的形状、数据类型、设备内存指针等关键信息,是模型推理、数据预处理和后处理的核心数据结构。原创 2025-05-14 20:50:10 · 137 阅读 · 0 评论 -
【算能】BMRuntime C API函数之bmrt_get_network_names详解
bmrt_get_network_names 是算能(Sophgo)BMRuntime C API 中用于获取已加载模型中所有网络名称列表的关键函数。它常用于处理多网络模型(如级联模型或多任务模型),原创 2025-05-14 05:31:33 · 229 阅读 · 0 评论 -
【算能】bmruntime结构体bm_stage_info_t详解
bm_stage_info_t 是算能(Sophgo)BMRuntime C API 中用于描述 模型推理阶段(Stage)配置信息 的核心结构体。它通常与 bm_net_info_t 配合使用,用于管理动态形状适配、多阶段推理流程及显存预分配等场景。原创 2025-05-13 15:14:51 · 99 阅读 · 0 评论 -
【算能】bmruntime结构体bm_net_info_t详解
bm_net_info_t 是 算能(Sophgo)BMRuntime C API 中用于描述加载的神经网络模型信息的核心结构体。它包含了模型的输入/输出张量的元数据(如形状、数据类型、内存占用等),是模型部署过程中配置输入输出、预分配内存和动态调整模型的关键依据。原创 2025-05-13 11:17:10 · 286 阅读 · 0 评论 -
【算能】通过 智能深度学习处理器(TPU) 同时实现前处理与后处理加速
在算能(Sophgo)的 TPU-MLIR 工具链中,通过 智能深度学习处理器(TPU) 实现 端到端的前处理与后处理加速 是优化边缘计算任务的关键技术。原创 2025-04-17 09:09:53 · 128 阅读 · 0 评论 -
【算能】通过 智能深度学习处理器(TPU)实现后处理加速
在算能(Sophgo)的 TPU-MLIR 工具链中,通过 智能深度学习处理器(TPU) 实现 后处理加速(如目标检测的 NMS、边框解码、分类的 Top-K 筛选等)可以显著减少 CPU 负载并提升端到端推理速度。原创 2025-04-17 09:03:07 · 251 阅读 · 0 评论 -
【算能】智能深度学习处理器(TPU)实现前处理加速
在算能(Sophgo)的 TPU-MLIR 工具链中,通过 智能深度学习处理器(TPU) 实现 前处理加速 是一种高效优化边缘计算任务的方法。原创 2025-04-17 08:49:38 · 205 阅读 · 0 评论 -
【算能】TPU-MLIR 工具链之run_sensitive_layer
run_sensitive_layer.py 是用于 量化敏感层分析 的核心脚本,其通过动态调整量化参数与混合精度策略,识别模型中量化误差敏感的关键层,从而提升量化模型的推理精度。原创 2025-04-16 13:43:48 · 105 阅读 · 0 评论 -
【算能】TPU-MLIR 工具链之run_calibration
run_calibration.py 是用于 生成量化校准表(Calibration Table) 的核心脚本,通过分析模型在校准数据上的激活值分布,确定各层的量化参数(Scale/Zero-Point)。原创 2025-04-16 11:52:37 · 146 阅读 · 0 评论 -
【算能】TPU-MLIR 工具链之model_qtable
model_qtable.py 是用于 量化参数调优 的脚本,主要用于分析模型的量化敏感度、生成混合精度配置或优化量化参数表(Quantization Table)原创 2025-04-16 11:44:36 · 126 阅读 · 0 评论 -
【算能】 TPU-MLIR 工具链之model_eval
model_eval.py 是用于 量化后模型精度验证与性能评估 的核心脚本,通过对比量化模型与原始模型的输出差异或直接计算任务指标(如mAP、分类准确率),帮助开发者验证量化效果。原创 2025-04-16 09:48:47 · 156 阅读 · 0 评论 -
【算能】TPU-MLIR 工具链之model_runner
model_runner.py 是用于 执行模型推理测试与性能分析 的核心脚本,支持对量化后的 BModel 或 MLIR 中间模型进行实际推理,验证模型功能正确性并测量硬件性能指标。原创 2025-04-16 09:46:05 · 178 阅读 · 0 评论 -
【算能】TPU-MLIR 工具链之model_deploy
model_deploy.py 是算能 TPU-MLIR 工具链中实现模型高效部署的核心组件,通过灵活的量化配置与硬件优化,可在 精度损失 ≤1% 的前提下实现 3-5 倍加速。开发者需重点关注校准数据质量、混合精度策略及硬件兼容性原创 2025-04-16 09:39:36 · 173 阅读 · 0 评论 -
【算能】TPU-MLIR 工具链之model_transform
model_transform.py 是TPU-MLIR工具链的第一步,其核心任务是完成模型格式转换与预处理配置。正确使用该脚本需注意输入参数的精确性(尤其是形状和预处理参数),并结合后续量化、编译工具实现高效部署。对于复杂模型(如YOLO、Transformer),建议通过Netron可视化模型结构以确定关键节点名称原创 2025-04-16 09:24:48 · 274 阅读 · 0 评论 -
【算能】YOLOv5 INT8量化的样本选择指南
针对算能平台(Sophgo)上 YOLOv5 INT8量化的样本选择指南,涵盖数据选择、预处理、校准策略及优化技巧,帮助您在保证精度的同时最大化推理效率。原创 2025-04-11 15:44:33 · 266 阅读 · 0 评论 -
【算能】BMRuntime、BMLIB 和 BMCV
BMRuntime、BMLIB 和 BMCV 是其 TPU 加速芯片(如 BM1684 系列)开发套件中的三大核心库,各自承担不同功能,共同构成从设备管理到模型推理的全栈工具链。原创 2025-04-10 07:28:44 · 126 阅读 · 0 评论 -
【算能】BMRuntime C++ 接口详解
该接口设计显著简化了 C 接口的繁琐操作,适合需要快速部署模型且注重代码可维护性的场景原创 2025-04-10 07:28:30 · 173 阅读 · 0 评论 -
【算能】BMRuntime 的 C 接口详解
算能 BMRuntime 的 C 接口 是其 SDK 生态中用于直接操作 TPU 芯片的核心编程接口,主要面向高性能、低延迟的推理场景设计。原创 2025-04-10 07:28:06 · 249 阅读 · 0 评论 -
【算能】BMRuntime框架的详解
算能BMRuntime凭借其高性能计算、加密安全支持及完善的工具链,成为国产边缘AI芯片中重要的推理框架。开发者可根据具体场景选择适配的BM芯片型号,结合量化与多线程优化进一步提升效率。原创 2025-04-10 07:27:42 · 163 阅读 · 0 评论 -
【算能】BM-OpenCV 和 BMCV 库的区别
SOPHON BM-OpenCV 和 bmcv 库是算能(Sophgo)为 BM 系列芯片设计的工具链中的两个核心组件,但它们的定位、功能和使用场景有显著区别。原创 2025-04-10 07:27:26 · 119 阅读 · 0 评论 -
【算能】BM-OpenCV 提供的核心工具函数分类及其详细说明
BM-OpenCV 提供的核心工具函数分类及其详细说明,涵盖图像处理、内存管理、视频编解码、AI推理加速等场景,帮助开发者高效利用BM芯片硬件加速能力。原创 2025-04-10 07:27:02 · 83 阅读 · 0 评论 -
【算能】BMLIB 和 BMCV库的区别
SOPHON 的 bmlib 和 bmcv 是 BM 芯片开发中的两个核心库,分别负责 底层硬件管理 和 计算机视觉算法加速。原创 2025-04-09 08:17:32 · 119 阅读 · 0 评论 -
【算能】BMCV 库中其他常用数据结构
BMCV 库中其他常用但未在前述分类中覆盖的核心 结构体,涵盖时间戳管理、异步任务、事件处理等场景,帮助开发者实现更复杂的图像处理逻辑。原创 2025-04-09 08:17:01 · 96 阅读 · 0 评论 -
【算能】BMCV库中与硬件配置相关的核心数据结构及其详细说明
BMCV 库中与硬件配置相关的核心 数据结构 及其详细说明,涵盖设备管理、芯片属性、硬件资源分配等关键部分,帮助开发者优化硬件资源使用并适配不同BM架构芯片。原创 2025-04-09 08:16:19 · 120 阅读 · 0 评论 -
【算能】BMCV 库中与内存管理相关的核心数据结构及其详细说明
BMCV 库中与内存管理相关的核心 数据结构 及其详细说明,涵盖设备内存分配、内存池、零拷贝优化等关键部分,帮助开发者高效管理硬件资源原创 2025-04-09 08:14:59 · 226 阅读 · 0 评论 -
【算能】BMCV库中与张量处理相关的核心数据结构及其详细说明
BMCV库中与张量(Tensor)处理相关的核心 及其详细说明,涵盖张量属性、内存布局和数据类型等关键定义,适用于深度学习模型推理和后处理任务。原创 2025-04-09 08:14:19 · 156 阅读 · 0 评论 -
【算能】BMCV 库中与图像处理相关的核心数据结构及其详细说明
BMCV库中与图像处理相关的核心 及其详细说明,涵盖图像格式、内存布局、操作区域等关键定义,帮助开发者高效管理图像处理流程。原创 2025-04-08 11:51:11 · 119 阅读 · 0 评论 -
【算能】BMCV 库中与绘制和标注相关的API函数分类整理
BMCV 库中与绘制和标注相关的 核心及高级API函数 分类整理,涵盖几何图形绘制、文字标注、批量操作及硬件加速功能,适用于目标检测、图像标注和可视化调试等场景原创 2025-04-08 11:31:51 · 93 阅读 · 0 评论 -
【算能】BMCV 库中与张量操作相关的API函数分类整理
BMCV 库中与张量操作相关的 核心及高级API函数 分类整理,涵盖张量创建、数学运算、量化转换及高性能计算场景,适用于深度学习模型推理和后处理任务原创 2025-04-08 11:25:38 · 92 阅读 · 0 评论 -
【算能】BMCV库中图像处理相关的API函数分类详解
BMCV 库中图像处理的核心及高级API函数分类详解,涵盖基础操作、硬件加速、批处理优化等场景,帮助开发者高效处理计算机视觉任务原创 2025-04-08 11:21:32 · 103 阅读 · 0 评论 -
【算能】BMCV 库中与内存管理相关的API函数分类整理
BMCV 库中与内存管理相关的 核心及高级API函数 分类整理,涵盖设备内存分配、生命周期管理、零拷贝优化及高性能场景设计,帮助开发者实现高效资源管理。原创 2025-04-08 11:18:14 · 84 阅读 · 0 评论 -
ONNX输出名称及算能TPU部署中的关键注意事项
在模型量化(PTQ)及硬件部署(如算能TPU)场景下,ONNX输出名称的规范性和一致性直接影响模型转换、量化工具链适配和推理流程。原创 2024-10-22 17:24:42 · 1085 阅读 · 0 评论 -
【算能】训练后量化(PTQ)深度解析
PTQ是平衡效率与精度的核心技术,尤其适合边缘计算与实时推理场景。在算能TPU生态中,结合TPU-MLIR工具链与硬件级优化,开发者可快速实现模型轻量化。关键成功因素包括:校准数据代表性、敏感层保护策略及硬件特性匹配。对于精度要求严苛的任务,建议后续探索QAT或混合精度方案。原创 2025-04-03 09:39:17 · 1204 阅读 · 0 评论 -
【算能】BMSDK各核心组件的功能分工及协作关系
算能(Sophgo)的 BMSDK(BM Software Development Kit) 是为其BM系列AI芯片(如BM1684/BM1688)设计的全栈开发工具链,涵盖从模型转换、推理加速到硬件资源管理的全流程。原创 2025-04-07 14:47:10 · 342 阅读 · 0 评论 -
【算能】BMCV 库中核心API函数的分类整理
算能(Sophgo)BMCV 库中核心API函数的分类整理,涵盖图像处理、内存管理、张量操作等关键功能,结合C/C++接口原型及典型应用场景说明原创 2025-04-07 14:17:34 · 192 阅读 · 0 评论 -
【算能】全面解析BMCV的功能、架构及实际应用
BMCV通过深度硬件协同设计,为BM系列芯片提供了高效的视觉计算能力,尤其适合边缘端实时推理场景。开发者可通过其高度优化的API快速实现从预处理到模型部署的全流程加速,同时显著降低功耗。原创 2025-04-07 14:10:17 · 179 阅读 · 0 评论
分享