- 博客(5)
- 收藏
- 关注
原创 一个 c++版本的 yolo 部署 (四)-- 基于cuda的预处理
本文详细介绍了图像预处理中的仿射变换和双线性插值算法。首先通过仿射变换实现图像的缩放和平移操作,利用齐次坐标将非线性变换转化为矩阵运算。然后阐述了双线性插值算法的原理,即通过目标网格在原图坐标中的四个邻点加权计算颜色值,并指出该算法天然适合并行计算。最后给出了基于CUDA的预处理代码实现,展示了如何利用GPU加速图像缩放、归一化和通道转换等操作。整个预处理过程包括计算逆变换矩阵、确定目标像素在原图的位置、进行加权颜色计算等步骤。
2025-07-02 18:00:00
1595
原创 一个 c++版本的 yolo 部署 (三)-- 基于opencv的cpu版预处理和分割后处理
本文摘要:介绍基于OpenCV的YOLO模型预处理与分割后处理实现方法。预处理包含图像缩放(保持长宽比)和通道转置归一化,将输入图像转换为CHW格式的float数组。后处理包括置信度过滤、NMS非极大值抑制、以及mask解码生成过程,最终输出目标检测框和对应的分割mask。关键参数包括置信度阈值0.3、NMS阈值0.5和mask阈值0.5,处理流程完整覆盖了从模型输入到结果输出的全过程。
2025-06-11 16:03:22
352
原创 一个 c++版本的 yolo 部署 (二)
YOLO模型简介与应用 本文介绍了YOLO模型的三种主要任务类型:分类(Classify)、检测(Detect)和分割(Segment)。分类任务输出各类别概率;检测任务提供目标位置和类别信息;分割任务通过权重和掩码精确提取物体轮廓。文章重点讲解了输入数据的预处理过程,包括HWC到CHW的格式转换和归一化处理,为后续基于OpenCV的实际应用处理打下基础。作为AI引擎,理解YOLO模型的输入输出结构是正确使用模型的关键。
2025-06-10 22:28:29
558
原创 一个 c++版本的 yolo 部署 (一)
C++版YOLO部署优化实践 项目起因于团队成员在YOLO模型部署中遇到性能瓶颈(700-800ms/i9+3070Ti),经分析发现前/后处理代码均为CPU版本且缺乏优化。作者利用业余时间开发了基于CUDA加速的C++部署模块,将处理时间从250ms提升至90ms。项目分三阶段推进:1)构建基准测试;2)开发CUDA算子加速;3)支持多系统兼容(当前已完成TensorRT支持)并重构代码架构,引入task/taskflow概念以适应多模型串联需求。项目仍在持续优化中,代码已开源。
2025-06-09 22:29:13
392
原创 小米 be6500pro+电信宽带,通过ipv6地址及 ddns访问内网设备
因为ipv6的复杂性,DHCPv6也更为复杂,是生成内网地址,还是生成公网地址,取决于运营商的策略+本地配置。印象中小米以前的路由器有个选项,是否允许外网访问web管理界面,但be6500pro没有这个设置项,猜测可能这个功能默认打开了,所以决定按照ipv4时代的思路,直接进行端口转发。从表面上看,这个路由器是支持ipv6的,因为有ipv6拨号,也有一个ipv6防火墙的开关,但是尝试用ipv6地址直接访问,预期能访问到路由器的web管理页面,实际上无法访问。,一共8段,每段以点分十六进制表示。
2025-04-13 20:46:49
2758
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅