booljin-优快云博客

原创一个 c++版本的 yolo 部署（四）-- 基于cuda的预处理

本文详细介绍了图像预处理中的仿射变换和双线性插值算法。首先通过仿射变换实现图像的缩放和平移操作，利用齐次坐标将非线性变换转化为矩阵运算。然后阐述了双线性插值算法的原理，即通过目标网格在原图坐标中的四个邻点加权计算颜色值，并指出该算法天然适合并行计算。最后给出了基于CUDA的预处理代码实现，展示了如何利用GPU加速图像缩放、归一化和通道转换等操作。整个预处理过程包括计算逆变换矩阵、确定目标像素在原图的位置、进行加权颜色计算等步骤。

2025-07-02 18:00:00 1595

原创一个 c++版本的 yolo 部署（三）-- 基于opencv的cpu版预处理和分割后处理

本文摘要：介绍基于OpenCV的YOLO模型预处理与分割后处理实现方法。预处理包含图像缩放（保持长宽比）和通道转置归一化，将输入图像转换为CHW格式的float数组。后处理包括置信度过滤、NMS非极大值抑制、以及mask解码生成过程，最终输出目标检测框和对应的分割mask。关键参数包括置信度阈值0.3、NMS阈值0.5和mask阈值0.5，处理流程完整覆盖了从模型输入到结果输出的全过程。

2025-06-11 16:03:22 352

原创一个 c++版本的 yolo 部署（二）

YOLO模型简介与应用本文介绍了YOLO模型的三种主要任务类型：分类(Classify)、检测(Detect)和分割(Segment)。分类任务输出各类别概率；检测任务提供目标位置和类别信息；分割任务通过权重和掩码精确提取物体轮廓。文章重点讲解了输入数据的预处理过程，包括HWC到CHW的格式转换和归一化处理，为后续基于OpenCV的实际应用处理打下基础。作为AI引擎，理解YOLO模型的输入输出结构是正确使用模型的关键。

2025-06-10 22:28:29 558

原创一个 c++版本的 yolo 部署（一）

C++版YOLO部署优化实践项目起因于团队成员在YOLO模型部署中遇到性能瓶颈（700-800ms/i9+3070Ti），经分析发现前/后处理代码均为CPU版本且缺乏优化。作者利用业余时间开发了基于CUDA加速的C++部署模块，将处理时间从250ms提升至90ms。项目分三阶段推进：1)构建基准测试；2)开发CUDA算子加速；3)支持多系统兼容（当前已完成TensorRT支持）并重构代码架构，引入task/taskflow概念以适应多模型串联需求。项目仍在持续优化中，代码已开源。

2025-06-09 22:29:13 392

原创小米 be6500pro+电信宽带，通过ipv6地址及 ddns访问内网设备

因为ipv6的复杂性，DHCPv6也更为复杂，是生成内网地址，还是生成公网地址，取决于运营商的策略+本地配置。印象中小米以前的路由器有个选项，是否允许外网访问web管理界面，但be6500pro没有这个设置项，猜测可能这个功能默认打开了，所以决定按照ipv4时代的思路，直接进行端口转发。从表面上看，这个路由器是支持ipv6的，因为有ipv6拨号，也有一个ipv6防火墙的开关，但是尝试用ipv6地址直接访问，预期能访问到路由器的web管理页面，实际上无法访问。，一共8段，每段以点分十六进制表示。

2025-04-13 20:46:49 2758

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 一个 c++版本的 yolo 部署 （四）-- 基于cuda的预处理

原创 一个 c++版本的 yolo 部署 （三）-- 基于opencv的cpu版预处理和分割后处理

原创 一个 c++版本的 yolo 部署 （二）

原创 一个 c++版本的 yolo 部署 （一）

原创 小米 be6500pro+电信宽带，通过ipv6地址及 ddns访问内网设备

空空如也

空空如也

原创一个 c++版本的 yolo 部署（四）-- 基于cuda的预处理

原创一个 c++版本的 yolo 部署（三）-- 基于opencv的cpu版预处理和分割后处理

原创一个 c++版本的 yolo 部署（二）

原创一个 c++版本的 yolo 部署（一）

原创小米 be6500pro+电信宽带，通过ipv6地址及 ddns访问内网设备