计算机视觉_AI大权的博客-优快云博客

计算机视觉

关注

文章平均质量分 78

OpenCV、PCL、CUDA、TensorRT、目标检测、PyTorch等

关注数：文章数：64 文章阅读量：91825 文章收藏量：843

作者: AI大权

这个作者很懒，什么都没留下…

展开

专栏收录文章

Open3D 对点云进行去噪（下采样、欧式聚类分割）02

使用Open3D针对不同点云场景类型（地面、建筑、植被、LiDAR）的智能去噪方法，通过自动调节下采样和DBSCAN聚类参数实现通用去噪效果。该方法主要包含以下特点：1）自动检测点云单位（毫米或米）并进行统一缩放处理；2）针对四种典型场景预设不同的参数组合（包括下采样粒度、邻域半径等）；3）保留原始点云颜色信息；4）提供可视化对比功能展示去噪效果。实验结果表明，该方法能根据不同场景特性自动优化参数，有效去除噪声点，同时保留关键几何特征。

原创 2025-06-09 15:11:28 · 1007 阅读 · 0 评论
Open3D 对点云进行去噪（下采样、欧式聚类分割）01

Open3D提供两种点云去噪方法：1）体素下采样（Voxel Downsample）降低点云密度并初步去噪；2）DBSCAN欧式聚类分割识别并移除孤立噪声簇。通过组合使用这两个方法，可有效去除噪声并保留主要结构。具体流程包括体素降采样、DBSCAN聚类和基于簇大小的噪声过滤。文中还给出了封装好的完整函数，可直接调用实现点云去噪处理

原创 2025-06-09 14:39:32 · 641 阅读 · 0 评论
Open3D 对点云进行去噪（统计滤波、半径滤波）

本文介绍了Open3D中两种点云去噪方法：统计滤波和半径滤波。统计滤波通过邻域点距离分布识别孤立点，适用于随机噪声；半径滤波则基于指定半径内的邻居数量去噪，适合结构化点云。文章详细说明了两种方法的参数设置和适用场景，并提供了完整的Python实现代码，包括可视化对比功能。最后给出了实际应用建议，如结合下采样处理密度不均的点云。代码示例可直接用于点云处理项目，帮助开发者快速实现去噪功能。

原创 2025-06-09 14:31:17 · 704 阅读 · 0 评论
Open3D点云可视化

Open3D是一个高效的3D数据处理开源库，支持点云和网格处理。它提供点云读写、滤波、可视化等功能，支持PLY、PCD等格式。通过示例代码展示了基础点云可视化方法，以及进阶处理技巧，包括深度范围筛选、镜像调整、背景和点大小设置。优化后的可视化效果更清晰，能有效去除无效远点并改善显示效果。

原创 2025-06-09 11:47:52 · 858 阅读 · 0 评论
目标检测任务的评估指标P-R曲线

P-R曲线（Precision-Recall Curve）是目标检测、图像分类等任务中常用的评估模型性能的工具之一。它通过展示精确率（Precision）和召回率（Recall）之间的关系来帮助我们理解模型的表现。

原创 2025-06-04 10:49:46 · 2212 阅读 · 0 评论
目标检测任务的评估指标mAP50和mAP50-95

mAP50 和 mAP50-95 是目标检测任务中常用的评估指标，用于衡量模型在不同交并比（IoU）阈值下的平均精度（Average Precision, AP）。它们的区别主要体现在 IoU 阈值范围上。

原创 2025-06-04 10:41:10 · 4237 阅读 · 0 评论
PyTorch 分布式训练（DDP）不同机器之间的进程通信

PyTorch 分布式训练（DDP）不同机器之间的进程通信

原创 2025-03-28 12:22:56 · 1391 阅读 · 0 评论
PyTorch单机多卡训练（DataParallel）

PyTorch单机多卡训练（DataParallel）

原创 2025-03-28 12:21:25 · 957 阅读 · 0 评论
PyTorch 分布式训练（Distributed Data Parallel, DDP）简介

DDP是PyTorch 提供的分布式训练接口

原创 2025-03-28 12:17:15 · 1453 阅读 · 0 评论
MolScribe 分子结构识别模型

MolScribe：一种分子结构识别模型，将分子实体的图像转换为SMILES字符串。

原创 2025-03-25 17:50:29 · 473 阅读 · 0 评论
OCR 识别案例

介绍了pytesseract、EasyOcr、ModelScope

原创 2025-03-25 10:34:04 · 923 阅读 · 0 评论
Python实现ONNXRuntime推理YOLOv11模型

【代码】Python实现ONNXRuntime推理YOLOv11模型。

原创 2025-03-21 16:11:58 · 633 阅读 · 0 评论
ONNX Runtime 与 CUDA、cuDNN 的版本对应

ONNX Runtime 与 CUDA、cuDNN 的版本对应关系是深度学习模型部署中的关键点，确保版本兼容性可以避免运行时错误并优化性能。以下是详细的版本对应关系及注意事项：

原创 2025-02-19 16:57:47 · 3710 阅读 · 0 评论
SAM C++ TensorRT（实时图像分割）

用于SAM（segment anything model分割一切模型）的TensorRT和CUDA优化的高表现C++实现，特别适用于实时图像分割任务。

原创 2025-02-19 15:26:17 · 880 阅读 · 0 评论
BiRefNet C++ TensorRT （二分类图像分割）

用`TensorRT`和`CUDA`的双边参考网络（`BiRefNet`）的高性能`c++`实现，针对实时高分辨率二分类图像分割进行了优化。

原创 2025-02-18 16:09:05 · 1074 阅读 · 0 评论
Linux(Ubuntu24.04)源码编译安装OpenCV4.6.0

Linux(Ubuntu24.04)源码编译安装OpenCV4.6.0

原创 2025-02-18 13:36:33 · 2142 阅读 · 0 评论
【OpenCV】在Liunx中配置OpenCV环境变量

在Liunx中配置OpenCV环境变量

原创 2025-02-18 10:47:06 · 1246 阅读 · 0 评论
OpenCL实现深度图生成点云功能

**PyOpenCL** 是一个用于在Python中访问和使用OpenCL（Open Computing Language）的库。OpenCL是一种开放标准，旨在使程序能够在不同的平台上高效运行，包括CPU、GPU、FPGA和其他类型的加速器。通过PyOpenCL，开发者可以在Python中编写并执行OpenCL代码，从而利用这些硬件加速计算任务。

原创 2025-02-14 17:53:46 · 1162 阅读 · 0 评论
图像缩放的双线性插值实现方式

双线性插值是一种用于在二维网格上进行插值的方法，适用于图像处理、计算机图形学等领域。它通过利用四个邻近点的已知值，估算出任意点的值。双线性插值在两个方向（通常是水平和垂直）上分别进行线性插值，因此得名“双线性”

原创 2025-02-14 17:40:23 · 962 阅读 · 0 评论
【OpenCV】双目相机计算深度图和点云

双目相机计算深度图的基本原理是通过两台相机从不同角度拍摄同一场景，然后利用视差来计算物体的距离。本文的Python实现示例，使用OpenCV库来处理图像和计算深度图。

原创 2025-02-13 13:34:50 · 3291 阅读 · 2 评论
使用瑞芯微RK3588的NPU进行模型转换和推理

使用边缘设备进行算法落地时，通常要考虑模型推理速度，NVIDA系列平台可以使用TensorRT和CUDA加速，瑞芯微RK3588的板子上都是Arm的手机GPU，虽然没有类似CUDA的加速计算方式，但是提供了NPU进行加速推理，本文说明了如何使用瑞芯微RK3588的NPU进行模型转换和推理

原创 2025-02-12 15:58:57 · 4489 阅读 · 0 评论
轻量级解决方案：唤醒词检测+固定语音指令识别

如果需要在Linux上运行一个轻量级的解决方案，完成**唤醒词检测**和**固定语音指令识别**，以下是推荐的工具和框架组合：

原创 2025-02-11 10:45:24 · 4268 阅读 · 0 评论
固定语音指令识别：从唤醒词到语义理解

完成固定语音指令识别的方法通常包括以下几个步骤：

原创 2025-02-11 10:40:03 · 1877 阅读 · 1 评论
TOF设备的SLAM项目推荐

TOF设备的SLAM项目推荐

原创 2025-02-10 13:21:22 · 1235 阅读 · 0 评论
SLAM的项目结构和推荐的一些SLAM项目

一个典型的SLAM项目结构包括数据采集、前端处理、后端优化、地图构建、定位、可视化、存储与日志、配置与参数、测试与评估等多个模块。每个模块各司其职，共同实现SLAM系统的功能。

原创 2025-02-10 09:08:17 · 1217 阅读 · 0 评论
ONNX动态量化后，如果继续使用TensorRT Engine，还需要继续量化吗?

在使用ONNX Runtime进行动态量化（）后，生成的ONNX模型已经是量化模型（通常是INT8精度）。

原创 2025-02-08 15:17:29 · 604 阅读 · 0 评论
6DoF头控简介

6DoF 头控（Six Degrees of Freedom Head Tracking）是一种基于 6 自由度的头部运动追踪技术，主要用于虚拟现实（VR）、增强现实（AR）和混合现实（MR）设备中，以实现更自然、沉浸式的交互体验。

原创 2025-02-06 16:09:30 · 1954 阅读 · 0 评论
Rokid 3D手势算法简介

Rokid 的 3D 手势算法通过单目摄像头和深度学习技术，实现了低成本、高精度的 AR 手势交互。该技术不仅提升了用户体验，还为 AR 应用开发提供了强大的技术支持，推动了 AR 技术的普及和发展。

原创 2025-02-06 14:49:14 · 1019 阅读 · 0 评论
自动驾驶视觉感知—— 多任务学习（HybridNets）

HybridNets多任务模型主要针对目标检测、可行驶区域分割和车道检测。在Berkeley DeepDrive Dataset （BDD100K）数据集上进行训练，达到SOTA的目标和车道检测。

原创 2025-01-24 16:27:14 · 1278 阅读 · 0 评论
开放神经网络交换中间表示（ONNX IR）规范

本文档包含ONNX语义的规范性规范。在[onnx文件夹](/onnx/)下的`.proto`和`.proto3`文件构成了其语法的规范性规范，这些文件使用[Protocol Buffers](https://developers.google.com/protocol-buffers)定义语言编写。`.proto`和`.proto3`文件中的注释旨在提高这些文件的可读性，但如果与本文档冲突，则不具有规范性。此类冲突应报告为文档错误。

原创 2025-01-24 13:30:26 · 1283 阅读 · 0 评论
【CUDA-BEVFusion】qat/export-camera.py 代码解读

【CUDA-BEVFusion】qat/quantize.py代码的主要功能是将一个名为 `bevfusion` 的模型导出为 ONNX 格式，支持 INT8 和 FP16 两种精度。

原创 2025-01-23 17:35:14 · 410 阅读 · 0 评论
导出 YOLOv11 模型的详细步骤和说明

YOLOv11 模型可以通过 Ultralytics 提供的接口轻松导出为多种格式，如 ONNX、TensorRT、CoreML 等。

原创 2025-01-23 16:46:48 · 1663 阅读 · 0 评论
TensorRT PTQ量化Calibrator介绍

在TensorRT中，PTQ（Post-Training Quantization，训练后量化）用于将浮点模型转换为INT8精度，以提升推理速度并减少内存占用。TensorRT提供了多种校准器（Calibrator）来实现INT8量化。

原创 2025-01-23 15:39:43 · 898 阅读 · 0 评论
TensorRT 显示量化和隐式量化的区别（Explicit vs Implicit Quantization）

量化网络可以通过两种（互斥的）方式进行处理：使用隐式量化或显式量化。这两种处理模式的主要区别在于是否需要显式控制量化，或者让 TensorRT 构建器选择哪些操作和张量进行量化（隐式）。以下部分提供了更多详细信息。隐式量化仅在量化到 INT8 时受支持。它不能与强类型一起使用（因为类型不会自动调整，唯一将激活值转换为 INT8 或从 INT8 转换回的方法是通过量化（Q）和反量化（DQ）操作符）。

原创 2025-01-23 15:13:15 · 547 阅读 · 0 评论
TensorRT INT8 量化YOLO模型—— trtexec

TensorRT 提供了 `trtexec` 工具，可以方便地将模型转换为 TensorRT 引擎，并支持 INT8 量化。`trtexec` 是一个命令行工具，适用于快速测试和部署模型，尤其适合对 ONNX 或 UFF 格式的模型进行量化和优化。

原创 2025-01-23 14:33:53 · 2109 阅读 · 2 评论
TensorRT INT8 量化YOLO模型—— python

TensorRT 是 NVIDIA 提供的高性能深度学习推理库，支持 INT8 量化以加速模型推理。TensorRT 支持从 ONNX 格式的模型进行量化。首先需要将 YOLO 模型导出为 ONNX 格式。

原创 2025-01-23 14:31:33 · 1159 阅读 · 0 评论
YOLOv11 模型量化综述

YOLOv11 是 Ultralytics 推出的最新目标检测模型，具有更高的精度和更少的参数量，适用于多种计算机视觉任务。模型量化是优化 YOLOv11 推理速度和减少资源占用的关键技术之一。以下是关于 YOLOv11 模型量化的详细解读和方法总结：

原创 2025-01-23 14:25:21 · 2305 阅读 · 0 评论
【CUDA-BEVFusion】模型量化qat/ptq.py代码说明

`qat/ptq.py`代码实现了一个**PTQ（Post Training Quantization）**的过程，主要用于对深度学习模型进行量化操作。

原创 2025-01-23 10:41:46 · 728 阅读 · 0 评论
QAT与PTQ模型量化方法的区别

QAT（Quantization Aware Training）和PTQ（Post Training Quantization）是两种常见的模型量化方法，用于减少深度学习模型的计算和存储开销，同时尽量保持模型的性能。

原创 2025-01-23 10:33:42 · 1777 阅读 · 0 评论
【TensorRT】trtexec的参数说明

【TensorRT】trtexec的参数说明

原创 2025-01-23 09:55:48 · 1939 阅读 · 0 评论

计算机视觉

作者: AI大权

Open3D 对点云进行去噪（下采样、欧式聚类分割）02

Open3D 对点云进行去噪（下采样、欧式聚类分割）01

Open3D 对点云进行去噪（统计滤波、半径滤波）

Open3D点云可视化

目标检测任务的评估指标P-R曲线

目标检测任务的评估指标mAP50和mAP50-95

PyTorch 分布式训练（DDP）不同机器之间的进程通信

PyTorch单机多卡训练（DataParallel）

PyTorch 分布式训练（Distributed Data Parallel, DDP）简介

MolScribe 分子结构识别模型

OCR 识别案例

Python实现ONNXRuntime推理YOLOv11模型

ONNX Runtime 与 CUDA、cuDNN 的版本对应

SAM C++ TensorRT（实时图像分割）

BiRefNet C++ TensorRT （二分类图像分割）

Linux(Ubuntu24.04)源码编译安装OpenCV4.6.0

【OpenCV】在Liunx中配置OpenCV环境变量

OpenCL实现深度图生成点云功能

图像缩放的双线性插值实现方式

【OpenCV】双目相机计算深度图和点云

使用瑞芯微RK3588的NPU进行模型转换和推理

轻量级解决方案：唤醒词检测+固定语音指令识别

固定语音指令识别：从唤醒词到语义理解

TOF设备的SLAM项目推荐

SLAM的项目结构和推荐的一些SLAM项目

ONNX动态量化后，如果继续使用TensorRT Engine，还需要继续量化吗?

6DoF头控简介

Rokid 3D手势算法简介

自动驾驶视觉感知—— 多任务学习（HybridNets）

开放神经网络交换中间表示（ONNX IR）规范

【CUDA-BEVFusion】qat/export-camera.py 代码解读

导出 YOLOv11 模型的详细步骤和说明

TensorRT PTQ量化Calibrator介绍

TensorRT 显示量化和隐式量化的区别（Explicit vs Implicit Quantization）

TensorRT INT8 量化YOLO模型—— trtexec

TensorRT INT8 量化YOLO模型—— python

YOLOv11 模型量化综述

【CUDA-BEVFusion】模型量化qat/ptq.py代码说明

QAT与PTQ模型量化方法的区别

【TensorRT】trtexec的参数说明