- 博客(42)
- 资源 (1)
- 收藏
- 关注
原创 [硬核] C++ YOLOv8 Onnx 加速部署(源码深度解析:动态Batch+CUDA加速+预处理对齐):从 V5 到 V8 的无缝迁移与避坑指南
在上一篇《YOLOv5 C++ 部署实战》中,我们封装了一套稳健的推理类。很多朋友私信我:“博主,我把模型路径换成,为什么程序不报错但什么都画不出来?这不是你的代码有 Bug,而是 YOLOv8 的输出逻辑变天了。YOLOv8 采用了和Decoupled Head(解耦头)设计,导致导出的 ONNX 模型输出维度发生了根本性的翻转。本文将带你通过仅修改核心模块,实现 V5 到 V8 的平滑升级。注。
2025-12-16 14:42:23
938
原创 YOLO C++ Onnx Opencv项目配置指南
摘要:在Visual Studio C++开发中,属性表(.props文件)是管理第三方库配置的关键工具,能显著提升工程化水平。其核心优势包括:1)全局配置复用,一处修改即可同步所有引用项目;2)通过相对路径解耦项目与环境,提升可移植性;3)自动区分Debug/Release配置,避免混用导致的崩溃;4)保持.vcxproj文件整洁,便于版本管理。属性表类似于CSS样式表,通过集中定义实现高效配置管理,是工业级项目的重要实践。
2025-12-16 14:31:11
552
原创 【硬核实战】C++ YOLOv5 OnnxRuntime 加速部署(源码深度解析:动态Batch+CUDA加速+预处理对齐)
本文详细介绍了YOLOv5模型在C++环境下的工业级部署方案。针对Python转C++部署常见的内存泄漏、坐标偏移等问题,重点解析了五个核心环节:1)智能GPU/CPU调度与跨平台路径处理;2)Letterbox预处理保持长宽比;3)HWC转NCHW的内存优化与OpenMP加速;4)动态Batch支持和零拷贝推理;5)后处理坐标还原公式。通过严谨的内存管理和细节优化,实现了稳定高效的工业部署方案,提供了可直接集成的完整源码。
2025-12-16 13:57:00
833
原创 C++基础入门
所谓数组,就是一个集合,里面存放了相同类型的数据元素**特点1:**数组中的每个数据元素都是相同的数据类型**特点2:**数组是由连续的内存位置组成的数据类型 数组名[ 数组长度 ];数据类型 数组名[ 数组长度 ] = { 值1,值2 ...};数据类型 数组名[ ] = { 值1,值2 ...};示例//定义方式1//数据类型 数组名[元素个数];//利用下标赋值//利用下标输出//第二种定义方式//数据类型 数组名[元素个数] = {值1,值2 ,值3 ...};
2024-02-06 10:51:56
1773
原创 Transformer
绿色的向量中“学”对应的softmax的值最高,输出“学”。我们输入一个sequence后,先由Encoder负责处理,再把处理好的结果输入到Decoder中,由Decoder决定最后输出什么样的sequence。接下来,将“器”对应的向量也作为Decoder的输入,这样Decoder会考虑下边三个输入,得出绿色的输出向量。,也就是上边说到的Decoder中比Encoder多出来的中的那一个Multi-Head Attention。接下来,将“机”对应的向量作为Decoder的输入,做下一步计算。
2023-03-31 14:59:40
4
原创 Transform之self-attention
Self-Attention注意力机制传统的RNN网络模型没有办法进行并行操作,需要不断的采集上一层的中间特征 ,无法进行独立,即不可以进行并行操作。Self-Attention注意力机制Self-attention是一种注意力机制(attention mechanism),它可以计算输入序列中每个元素与其他元素的相关性并根据相关性生成新的表示。self-attention的优点是可以捕捉长距离的依赖关系,而不受固定窗口的限制。
2023-03-29 10:49:30
7
YoloV5 C++ OnnxRuntime 推理程序(优化加速)
2025-12-16
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
3