深度学习部署教程-包代码-包讲解
文章平均质量分 91
这节课主要是对部署端进行一个基础学习,如果你主要进行模型优化,而不打算进行板端部署,可以跳过本节。等你接触到RKNN的部署和TensorRT再回头学习。
余额抵扣
助学金抵扣
还需支付
¥29.90
¥99.00
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
博导YOLO君教程
本人为中山大学在读博士后,优快云热门专栏第83名,作者原创力56名,曾荣获全国数学建模大赛一等奖、无人车室外驾驶竞赛全国二等奖等荣誉。购买本人专栏可以私信我获取其他专栏内容,也就是你够买一个专栏相当于获得4个专栏的内容,500篇文章!本人还会不断更新,先到先得,优化有视频讲解
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
基于YOLOv5s的RK3588多线程部署16FPS暴涨到120FPS 轻量化深度学习部署实战教程(包括性能优化与加速)37
本文介绍了如何在RK3588平台上利用线程池优化YOLOv5模型的推理性能。RK3588内置3个NPU核心,支持多核并行处理。作者设计了一个线程池架构:1个线程负责数据读取,10个线程处理NPU运算,1个线程输出结果。该架构包含任务队列、线程管理和工作线程三个核心组件,通过合理设置线程数、任务队列大小等参数确保性能稳定。文章提供了详细的C++实现代码,包括线程池初始化、任务提交、结果获取等功能模块,并讨论了多线程同步和内存管理的关键技术要点。该方案可显著提升深度学习模型在嵌入式设备上的部署效率。原创 2025-07-28 23:32:29 · 5425 阅读 · 4 评论
-
基于YOLOv5的RK3588部署与int8量化 轻量化深度学习部署实战教程(包括性能优化与加速)35
摘要: 本文介绍了YOLOv5模型在RK3588芯片上的优化部署方法,重点对比了原始ONNX模型与RKNN支持的ONNX模型结构差异。通过删除box decode操作并将后处理移至NPU外运行,提升了检测速度。文中详细解析了模型转换原理,包括特征图变形、anchor处理及解码流程,并提供了模型轻量化、多线程推理和NPU加速的优化方案。实验测试了图像预处理(letterbox)、模型量化、RGA加速等方法对性能的影响,结果显示优化后帧率可达24FPS。此外,还介绍了RK3588的NPU资源监控方法,帮助开发者原创 2025-07-27 18:18:47 · 2773 阅读 · 0 评论
-
YOLOv5 Jetson Nano部署
本文介绍了在Jetson NX和Nano设备上部署YOLOv5模型并进行性能测试的方法。在Jetson NX上,YOLOv5n模型多线程处理720P视频时可达94FPS,而Jetson Nano性能较低,单线程处理720P视频仅12.84FPS。文章详细提供了两种设备的硬件配置、环境准备步骤、编译参数以及不同模型(YOLOv5s/YOLOv5n)在各种场景(文件/RTSP输入,开启/关闭推流)下的性能测试数据。测试结果表明,多线程能显著提升处理速度,而推流操作会降低帧率。文末还附有代码下载链接和硬件配置截图原创 2025-08-31 12:31:34 · 3038 阅读 · 0 评论 -
RTSP推流 INT8量化 行人检测
本文介绍了RTSP/RTMP推流技术及其在YOLOv5目标检测中的应用。主要内容包括:1) RTSP协议原理与8554端口配置;2) 使用VLC进行网络流获取;3) Docker端口映射(1935/8554)实现本地拉流;4) 结合FFmpeg和OpenCV实现视频推流,通过修改比特率适配不同分辨率;5) 在容器环境中部署YOLOv5,实现检测后的实时推流效果。文中提供了详细的命令行操作和错误解决方案,最终通过VLC成功验证推流效果。原创 2025-08-31 12:26:53 · 2854 阅读 · 0 评论 -
Docker+TensorRT推理优化 YOLO人体检测
本文介绍了在RK3588平台上使用Docker部署YOLOv5目标检测模型的完整流程。主要内容包括: 环境配置 推荐使用Docker方式部署,避免CUDA环境配置问题 详细说明Docker和NVIDIA容器工具包的安装步骤 提供PyTorch容器的拉取和使用方法 YOLOv5部署 克隆指定版本的YOLOv5代码库 安装依赖项和预训练权重 测试模型推理效果 自定义训练(可选) 介绍使用labelImg工具标注数据 说明YOLO格式标注文件的要求 提供数据集准备规范 注意事项: 部署需要约30GB存储空间 容器原创 2025-08-31 12:22:59 · 2846 阅读 · 0 评论 -
剪枝-稀疏训练-微调的关系与实现
【摘要】本文探讨了神经网络稀疏训练与剪枝技术的原理与应用。稀疏训练通过L0/L1正则化约束权重,实现部分权重归零,但需配合加速库才能提升速度;动态稀疏训练(DST)采用掩码机制动态调整权重。剪枝分为训练后剪枝和训练时剪枝,包括非结构化(权重剪枝)和结构化(通道/层剪枝)两种方式。实验对比显示:结构化剪枝在保持98.4%准确率的同时将参数量减少至126664,而非结构化剪枝仅置零权重不改变模型结构。文中指出全连接层更适合非结构化剪枝,并强调需注意模型保存格式(pth/pt)对结构化剪枝的影响。原创 2025-08-31 12:16:51 · 1682 阅读 · 0 评论 -
深度学习部署 基础篇cmake+调用 人脸检测模型
本文介绍了基于RK3588平台的深度学习部署方案,主要内容包括:1. 开发环境配置,使用VSCode结合CMake进行调试;2. OpenCV基础操作,涵盖图片/视频/摄像头读取、图像处理(颜色转换、滤波、形状调整、绘制等);3. RTSP视频流处理,包括本地构造和使用ffmpeg解码;4. 人脸检测示例,使用OpenCV提供的轻量级MobileNet-SSD模型。文章提供了详细的代码示例和配置说明,适合深度学习部署工程师参考学习。相关资源链接和完整源码可在文末获取。原创 2025-08-31 11:52:20 · 2821 阅读 · 0 评论 -
深度学习部署 基础篇
文章摘要:本文介绍了C++类与容器的核心知识,包括类的封装、构造函数、拷贝控制、智能指针、模板编程等内容。重点讲解了银行账户类的实现,涵盖public/private访问控制、成员函数、初始化列表等特性。同时详细解析了STL容器(array/vector/deque/list/set/map)和容器适配器(stack/queue/priority_queue)的使用场景及特性差异。文章还涉及迭代器、STL算法等高级主题,并提供了相关代码示例和百度网盘资料链接。适合有一定C++基础的学习者提升面向对象编程和标原创 2025-08-31 11:49:15 · 2830 阅读 · 0 评论 -
深度学习部署 基础C++
本文摘要: 文章主要介绍了RK3588开发板相关技术应用和C++编程知识。内容包括RK3588的YOLOv5部署、NPU测试、刷机教程,以及深度学习部署工程师需要掌握的TensorRT、CMake等技能。重点讲解了C++指针的概念与使用方法,如指针声明初始化、解引用操作、动态内存分配(new/delete)等核心知识。通过多个示例代码(如func_demo.cpp、pointer_allo.cpp等)详细演示了函数定义、数组与指针关系、参数传递、函数重载等编程技巧。文章提供了配套的course2.zip学习原创 2025-08-31 11:46:55 · 2791 阅读 · 0 评论 -
TensorRT INT8量化 CMake工程化
摘要:本文介绍了RTSP/RTMP推流技术在YOLOv5目标检测中的应用,包括RTSP协议原理、端口配置、VLC工具安装,以及Docker环境下的端口映射方法。详细讲解了如何在容器中部署YOLOv5模型,通过FFmpeg实现视频流推送,并利用VLC进行实时拉流验证。文章还涉及TensorRT加速推理、OpenCV视频处理等关键技术,最终实现检测结果的低延迟流媒体传输。源码包含完整的推流实现和性能优化方案。原创 2025-08-31 11:42:59 · 2781 阅读 · 0 评论 -
CMake+RTSP推流 Ubuntu
文章摘要:本文介绍了基于RK3588平台的深度学习部署技术,主要包括RTSP/RTMP视频推流、YOLOv5目标检测、TensorRT加速推理等应用。重点讲解了聚众人群检测算法(K-means聚类)和人员闯入检测(射线法判断点与多边形位置关系),并分析了多线程流水线性能优化方案,提供了不同分辨率下的FPS测试数据。文章还涉及docker部署、RKNN函数封装等RK3588开发相关内容。原创 2025-08-31 11:41:07 · 2765 阅读 · 0 评论 -
TensorRT工作原理基础知识
TensorRT 深度解析与部署实践 本文系统介绍了 TensorRT 的核心工作机制和优化策略。主要内容包括: 对象生命周期管理:重点讲解工厂模式在 TensorRT 中的应用,特别是引擎创建后的对象销毁规则 日志与错误处理:详细说明 Logger 接口的实现要求、日志级别配置,以及 ErrorRecorder 的错误处理机制 内存管理优化:深入分析构建阶段和运行阶段的内存使用模式,包括临时内存分配、工作空间配置、内存共享策略等关键优化技术 高级特性:介绍自定义内存分配器、CUDA 延迟加载等高级功能,以原创 2025-08-31 11:37:56 · 2765 阅读 · 0 评论 -
TensorRT INT8量化 多线程优化 YOLOv5
本文详细介绍了YOLOv5模型在RK3588平台上的部署流程,包括TensorRT插件实现和decode解码过程。主要内容包括: YOLOv5 decode流程解析 输入图片经过3个head特征图([255,80,80]/[255,40,40]/[255,20,20]) 通过变形处理转换为[25200,85]输出格式 详细解释了bx/by/bw/bh的计算方法 TensorRT插件实现 介绍了插件开发的基本流程 核心需要实现configurePlugin、enqueue等方法 重点说明了序列化/反序列化的实原创 2025-08-31 11:36:36 · 2744 阅读 · 0 评论 -
Ubuntu YOLOv5 TensorRT加速
本文介绍了如何在RK3588平台上使用DeepStream进行人车目标识别与跟踪的项目实战。主要内容包括:1)通过Docker或本地方式运行DeepStream环境;2)使用YOLOv5模型生成engine文件并进行目标检测;3)配置跟踪算法实现目标ID号追踪(支持NvDCF和IOU两种方式);4)RTSP推流和视频文件处理;5)基于DeepStream SDK开发自定义应用的方法。文章提供了完整的代码实现路径和配置修改说明,并展示了实际运行效果图。该项目可应用于智能监控、异常行为检测等场景。原创 2025-08-31 11:35:14 · 2759 阅读 · 0 评论 -
Jetson YOLOv5 目标跟踪
本文介绍了在Jetson NX和Nano设备上部署DeepStream和YOLOv5的实践方法。首先详细说明了Jetson NX上安装DeepStream 6.2的步骤,包括依赖库安装、librdkafka编译配置和SDK安装。其次针对Jetson Nano设备(不支持DeepStream 6.2)给出了DeepStream 6.0.1的安装方案。文章还包含YOLOv5模型处理流程,从修改网络结构、导出ONNX到生成engine文件,并提供了CUDA核函数代码实现YOLO层计算。最后对比了不同Jetson设原创 2025-08-31 11:33:53 · 2712 阅读 · 0 评论 -
Jetson NX/Nano YOLOv5 TensorRT
这篇文章介绍了在Jetson NX和Nano设备上部署DeepStream和YOLOv5的详细步骤。主要内容包括:在Jetson NX上安装DeepStream 6.2所需的依赖库,配置librdkafka,下载并安装SDK;在Jetson Nano上安装DeepStream 6.0的类似过程;以及如何将训练好的YOLOv5模型转换为ONNX格式并生成engine文件。文章还提供了CUDA核函数代码示例,用于实现YOLO层计算。这些内容为在边缘设备上部署深度学习目标检测模型提供了完整的技术指导。原创 2025-08-29 23:49:03 · 2721 阅读 · 0 评论 -
人体姿态估计 Jetson Nano
本文介绍了基于RK3588平台和HRNet模型的骨骼点检测部署流程。主要内容包括:1)在Docker环境中导出HRNet模型为ONNX格式;2)使用TensorRT优化模型并实现RTMP推流,多线程处理可达25FPS;3)对比了自顶向下和自底向上两种骨骼点检测方法的特性。文章提供了完整的代码实现和部署步骤,适用于人体姿态估计等需要精细空间信息的应用场景。原创 2025-08-29 23:45:57 · 2769 阅读 · 0 评论 -
TensorRT部署 背景虚化 Jetson
往期文章RK3588+docker+YOLOv5部署:https://blog.youkuaiyun.com/FJN110/article/details/149673049RK3588测试NPU和RKNN函数包装https://blog.youkuaiyun.com/FJN110/article/details/149669753RK3588刷机:https://blog.youkuaiyun.com/FJN110/article/details/149669404。原创 2025-08-29 23:43:00 · 2702 阅读 · 0 评论 -
TensorRT 人脸关键点 C/C+
这篇文章介绍了基于RK3588平台的人脸检测与识别系统部署方案。主要内容包括:1)使用TAO工具包的预训练FaceDetect模型进行人脸检测,详细说明了模型转换和TensorRT部署流程;2)基于PyTorch训练人脸识别模型(FaceNet),包含数据清洗、口罩生成等预处理步骤;3)将训练好的模型导出为ONNX格式并转换为TensorRT引擎;4)展示了人脸检测、关键点识别和添加口罩的最终效果。文章提供了完整的代码路径和环境配置说明,涉及TensorRT、Docker、C++等技术栈,适用于深度学习部署原创 2025-08-29 23:19:49 · 2763 阅读 · 0 评论 -
Jetson Nano 口罩检测
本文介绍了在Jetson系列设备(NX/Nano)上部署深度学习模型的完整流程。主要内容包括:1)使用TAO工具转换模型格式;2)编译和运行人脸检测、属性分析(性别/年龄/情绪/口罩)等模型;3)提供完整的C++示例代码,包含模型加载、推理执行和结果处理;4)针对不同设备(NX/Nano)的编译注意事项和CUDA架构调整方法;5)配套的源码和资源文件下载链接。文中还涉及TensorRT引擎的创建、反序列化和推理过程,以及输入输出缓冲区的管理方法,为边缘计算部署提供了实用参考。原创 2025-08-29 23:15:52 · 2739 阅读 · 0 评论 -
YOLOv5 Tensor 车辆检测
本文介绍了基于NVIDIA TAO工具包的LPRNet车牌识别系统训练与DeepStream部署流程。主要内容包括:1) 使用YOLOv5和YOLOv4-tiny构建车体与车牌检测模型;2) 通过TAO工具包训练LPRNet车牌识别模型,详细说明了数据准备(包含车牌生成脚本)和训练步骤;3) 规划DeepStream处理流水线,整合检测与识别模块。文章提供了完整的开源代码链接和TAO模型资源,适合需要快速实现智能交通场景下车牌识别系统的开发者参考。原创 2025-08-29 23:13:04 · 2747 阅读 · 0 评论 -
RK3588 YOLOv5 深度学习部署实战RK3588 教程(包括性能优化与加速)
本文介绍了在RK3588平台上部署YOLOv5模型的环境配置流程。主要内容包括:1) Docker环境安装,包括基础Docker和NVIDIA容器工具包的配置;2) 使用PyTorch Docker镜像转换YOLOv5模型为ONNX格式;3) 修改YOLOv5网络结构使其兼容RKNN NPU;4) 在RK3588上安装RKNN-Toolkit工具包。文章提供了详细的命令步骤和注意事项,特别强调了模型转换过程中需要进行的结构修改,并给出了不同版本工具包的选择建议。整个流程旨在利用Docker容器简化环境配置,原创 2025-08-28 21:12:30 · 1892 阅读 · 0 评论 -
基于YOLOv5的RK3588部署与RGA 轻量化深度学习YOLOv5部署实战教程(包括性能优化与加速)
RK芯片中的RGA(Rockchip图形加速器)是一个用于图像处理的硬件加速模块,可执行缩放、旋转等2D图形操作。在YOLOv5预处理中,我们利用RGA实现letterbox补边和图像缩放,替代OpenCV处理。实验对比发现,在小尺寸图像上RGA加速效果不明显,甚至出现速度下降(13-17fps),可能由于内存操作耗时和图像尺寸不足导致性能未充分发挥。代码示例展示了如何通过RGA的imresize和immakeBorder接口实现图像预处理。需要注意的是,官方已下架RGA相关代码,这可能影响实际应用效果。原创 2025-08-28 21:16:30 · 1983 阅读 · 0 评论 -
RK3588 NPU 测试与 RKNN 函数封装实战教程 RK3588YOLO部署
步骤模块关键 API / 函数1图像预处理OpenCV2加载与初始化模型rknn_init3获取输入输出数量rknn_query4获取张量属性5设置模型输入6执行推理rknn_run7获取模型输出8后处理(如 top-k)自定义函数 + softmax结果处理9释放资源等RKNN是瑞芯微推出的一套神经网络推理框架,可以将神经网络模型转换为RKNN模型,然后在NPU上进行推理。原创 2025-08-28 21:14:44 · 1792 阅读 · 0 评论 -
2025电赛嵌入式k210训练模型 全网独家
本文介绍了在K210开发板上运行神经网络的全过程,重点针对亚博开发板与Sipeed开发板的兼容性问题。主要内容包括:1)数据集采集方法,通过按键拍照保存到SD卡;2)图像尺寸要求(320x240或224x224);3)使用嘉楠科技和MaixHub平台训练模型的差异与限制;4)固件烧录注意事项,建议使用Sipeed固件解决兼容性问题;5)摄像头和LCD显示翻转问题的代码修改方案。文章特别提醒开发者注意不同开发板的外设IO口差异,并提供了详细的解决方案,帮助用户成功在亚博开发板上运行MaixHub训练的模型。原创 2025-07-31 00:26:15 · 93 阅读 · 0 评论 -
2025电赛嵌入式k210电磁炮讲解寻找色块 包源码
本文介绍了K210开发板的基础视觉开发流程。首先讲解了摄像头和LCD屏幕的初始化方法,包括画面格式设置、帧率优化等基本操作。随后详细演示了颜色识别功能,通过LAB色彩空间阈值调节,实现对特定颜色物体的追踪。文中还提供了提高帧率的技巧,如开启双缓冲区和调整画面质量。最后展示了如何通过find_blobs函数识别红色矩形目标,并获取其位置信息。这些技术可直接应用于类似全国大学生智能车竞赛等项目的视觉识别任务。原创 2025-07-31 00:17:33 · 83 阅读 · 0 评论 -
2025电赛嵌入式:K210教程-如何刷固件 如何烧录代码 全网唯一
本文介绍了K210开发板的固件刷写和开发环境搭建方法。主要内容包括:1)从Sipeed官网下载合适的MaixPy固件,根据需求选择完整版或精简版;2)使用k-flash等工具烧录固件,注意区分亚博和Sipeed开发板的固件版本;3)介绍了擦除闪存的两种模式(部分擦除和完全擦除)及其应用场景;4)搭建CanMV开发环境,通过MaixPy IDE连接开发板并进行程序调试。文章还提供了常见问题的解决方法,如串口驱动安装、固件兼容性检查等,为K210开发提供了完整的入门指南。原创 2025-07-30 23:54:20 · 287 阅读 · 0 评论 -
2025电赛嵌入式基础知识:K210、亚博、SIPEED的关系
K210芯片由嘉楠科技开发,并由SIPEED和亚博等厂商封装。SIPEED开发了MaixPy固件库和IDE,将MicroPython移植到K210,支持AI视觉和音频处理。亚博则采用嘉楠科技的CanMV IDE,两者库函数略有差异但可互刷固件。由于厂商各自开发工具链,初学者容易混淆。建议结合官方文档学习,为后续神经网络开发打下基础。本教程将涵盖多种解决方案,帮助入门K210视觉开发。原创 2025-07-30 23:45:13 · 133 阅读 · 0 评论 -
K210与stm32串口通讯讲解,包源码和视频讲解
该代码为Sipeed MaixPy开发板(K210芯片)的MicroPython程序,主要实现摄像头图像采集、LCD显示和UART通信功能。程序初始化了摄像头(QVGA分辨率、RGB565格式)、LCD屏幕和UART2串口(115200波特率),通过无限循环持续捕获图像并显示在LCD上,同时每帧通过串口发送固定数据"91"。虽然代码配置了按键GPIO引脚,但未实现按键检测功能。注释显示原计划实现颜色识别(如检测黄色时发送特定数据),但当前版本仅作为基础框架运行,包含帧率计数和调试信息输出原创 2025-07-30 23:36:57 · 55 阅读 · 0 评论 -
openmv+卡尔曼滤波预测点的轨迹—预测红色球体跟踪系统
本文实现了一个基于卡尔曼滤波的红色球体跟踪系统。系统通过摄像头采集图像,使用颜色阈值检测红色球体,并采用卡尔曼滤波算法对目标位置进行预测和更新以提高跟踪稳定性。当检测到目标时,系统通过UART串口发送目标坐标数据(包括符号位和数据位)及存在标志位。代码中包含了传感器初始化、图像处理、卡尔曼滤波实现和数据打包发送等完整功能模块,适用于嵌入式视觉跟踪应用场景。系统采用320x240分辨率,通过优化阈值参数和滤波参数来提高跟踪精度和鲁棒性。原创 2025-07-30 23:29:56 · 159 阅读 · 0 评论 -
基于YOLOv5的RK3588部署与RGA 轻量化深度学习部署实战教程(包括性能优化与加速)36
本文介绍了在RK3588芯片上使用RGA硬件加速器优化YOLOv5图像预处理的方法。通过对比实验发现,RGA实现的letterbox处理速度(约16fps)反而比OpenCV(约22fps)更慢且不稳定。文章详细说明了RGA的功能特性、YOLOv5预处理流程中的关键步骤(letterbox和BGR2RGB转换),以及通过监控命令观察RGA核心运行状态的方法。虽然RGA理论上能加速2D图形操作,但实际测试结果表明在当前应用场景下性能反而下降,这为RK3588平台的深度学习部署优化提供了重要参考。原创 2025-07-28 00:06:36 · 4568 阅读 · 1 评论 -
RK3588 Docker YOLOv5 深度学习部署实战教程(包括性能优化与加速)34
本文介绍了在RK3588设备上安装Docker和部署YOLO模型的流程。主要内容包括:1) 说明Docker安装的必要性,建议在本地电脑而非RK3588上安装Docker;2) 详细列出Docker安装命令和nvidia-container-toolkit配置步骤;3) 演示如何启动PyTorch镜像并验证环境;4) 指导YOLOv5代码克隆、依赖安装和模型导出;5) 说明需要对原始代码进行修改才能导出适用于NPU的模型,提供自动修改的git patch文件使用方法。文章强调使用Docker可以降低环境配置原创 2025-07-27 00:02:44 · 308 阅读 · 0 评论 -
RK3588 NPU 测试与 RKNN 函数封装实战教程 深度学习部署工程师33
本文介绍了在RK3588开发板上进行NPU测试的完整流程。首先通过VS Code SSH连接并移植代码,使用MobileNet V1模型进行测试,成功运行后展示了Top5分类结果。详细讲解了图像预处理、RKNN模型初始化、输入输出配置、推理执行及结果处理等关键步骤,并提供了相应的C++代码示例。文章还介绍了对RKNN API进行封装的方法,方便后续调用。最后给出了完整的工作流程总结,包括从图像预处理到资源释放的9个关键步骤,为开发者提供了在RK3588上部署NPU应用的实用指南。原创 2025-07-26 19:06:05 · 295 阅读 · 0 评论 -
RK3588 环境配置与部署实战教程(香橙派开发板)深度学习部署工程师32
摘要:本文介绍了香橙派5 Plus(RK3588)开发板的硬件准备和系统安装步骤。主要内容包括:1)硬件准备清单(TF卡、电源、散热配件等);2)使用官方工具烧录Ubuntu镜像到SD卡;3)通过ifconfig获取IP地址,使用VSCode SSH插件远程连接开发板;4)解答了不同厂家RK3588设备的差异问题,指出不同厂家的镜像通常不能混用,主要因硬件适配、驱动和启动流程存在差异。文章还提供了香橙派官方资源链接和安装过程中的注意事项。原创 2025-07-26 17:33:51 · 4120 阅读 · 0 评论 -
SMOKE 3D:从 Python 到 C++ 实现车辆与行人单目 3D 视觉识别 深度学习部署工程师-31
SMOKE是一种单阶段端到端的单目3D目标检测方法,直接通过预测关键点位置来估计3D目标信息。文章详细介绍了SMOKE模型的ONNX导出和TensorRT引擎构建过程,包括环境配置、依赖库安装、模型转换等步骤。重点解析了SMOKE的后处理解码过程,涉及深度信息恢复、3D中心点投影计算、目标体积估计和偏航角计算等关键步骤,并提供了相关数学公式和C++实现代码。该方法通过直接回归3D框参数,避免了传统方法中2D检测+后处理的复杂流程。原创 2025-07-25 23:46:04 · 93 阅读 · 0 评论 -
MODNet+TensorRT部署实战:Ubuntu下实时背景虚化/软抠图加速方案(附完整代码)30
MODNet(Mobile-Optimized Domain Adaptation Network)是一种轻量级、高效的人像抠图模型,专为移动端与资源受限设备优化。与传统依赖 trimap 的抠图方法不同,MODNet 采用端到端的深度学习结构,实现了无需手工辅助标注的实时软分割(Soft Segmentation),尤其擅长处理头发、边缘等复杂细节。该模型基于 MobileNetV2 构建,具有小模型体积、高推理速度和良好精度,适用于图像/视频合成、AR背景替换、视频剪辑等场景。原创 2025-07-25 22:31:10 · 62 阅读 · 0 评论 -
NVIDIA TAO Toolkit实战指南:LPRNet车牌识别模型全流程部署教程(训练+优化+推理)29
本文介绍了基于NVIDIA TAO Toolkit实现LPRNet车牌识别系统的完整流程。首先在NGC Catalog中搜索并选择合适的预训练模型,分析其适用范围和训练要求。然后搭建TAO Toolkit容器训练环境,准备数据并配置spec文件进行模型训练。最后详细说明模型部署方案,包括通过DeepStream加载模型、构建推理流程等步骤。文中提供了关键文档链接和问题解决技巧,帮助开发者快速实现从模型训练到实际应用部署的全过程。原创 2025-07-25 17:58:06 · 130 阅读 · 0 评论 -
多模型车牌识别系统实战:YOLOv5车辆检测+YOLOv4-tiny车体定位+Tensor推理优化(完整源码)28
基于DeepStream的车牌识别系统实现 本文介绍了使用DeepStream框架实现车牌识别系统的详细步骤。系统采用三阶段和二阶段两种运行模式: 系统运行步骤 环境准备:启动DeepStream容器并安装必要依赖 模型转换:使用tao-converter将etlt模型转为engine格式 视频处理:从视频中提取样本帧用于校准 构建程序:编译并生成可执行文件 运行系统:支持RTMP/RTSP流媒体输入 关键技术 使用YOLOv5s模型进行车牌检测 采用LPRNet进行车牌识别 支持多分辨率输入和批量处理 实原创 2025-07-25 17:47:55 · 362 阅读 · 0 评论 -
多模型车牌识别系统实战:YOLOv5车辆检测+YOLOv4-tiny车体定位+Tensor推理优化(完整源码) 27
本文介绍了基于Deepstream的车牌检测与识别系统开发流程。主要内容包括:1)使用YOLOV5进行车体检测,YOLOV4-tiny进行车牌检测;2)采用NVIDIA TAO工具包训练LPRNet车牌识别模型;3)使用脚本模拟生成中文车牌数据用于模型训练;4)详细说明了数据准备、模型训练、可视化评估等关键步骤;5)重点阐述了TAO工具包的优势及其在深度学习应用开发中的重要作用。该系统通过优化模型结构与训练流程,显著提升了车牌识别的准确率和推理效率,具有较高的工程应用价值。原创 2025-07-25 11:47:48 · 94 阅读 · 0 评论 -
人体姿态估计轻量化部署:Tensor推理+单/多线程性能对比(含Jetson Nano/NX源码与优化指南)26
HRNet通过多分辨率并行结构持续保持高分辨率特征表示,在人体姿态估计等任务中表现出色。其核心在于bottom-up的HigherHRNet算法,利用heatmap检测关键点并通过Associative Embedding实现点对分组。导出模型后,可编译为TensorRT engine进行高效推理。相比传统方法,HRNet减少了信息丢失,在遮挡场景下仍能保持较高精度,同时具备较好的计算效率。原创 2025-07-24 00:24:33 · 267 阅读 · 0 评论
分享