计算机视觉关键技术
文章平均质量分 83
计算机视觉关键技术,包括YOLO的前向和后处理,模型解析,开源视觉标注工具的介绍和使用步骤。
CV小涵
计算机211硕士毕业,交流请看文章底部名片,置顶实时更新目录,专注计算机视觉、RAG研究!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
YOLO11实例分割训练任务——从构建数据集到训练的完整教程
介绍了YOLO11分割数据集的构建与训练方法。关键点包括: YOLO11分割数据集特性:相比检测任务需要像素级掩码标注,格式包含归一化坐标和轮廓点; 数据准备:建议从公开数据集复用或实地采集,注意场景多样性和标注精度控制; 实操流程:详细说明从LabelMe标注到YOLO格式转换、数据划分和模型训练的具体步骤; 性能优化:通过改进模型架构(BiFormer注意力机制等)和高质量数据集来提升分割精度。 文中还提供了完整的代码示例,帮助读者快速实现YOLO11分割任务的训练。原创 2025-11-19 21:55:39 · 1341 阅读 · 0 评论 -
用 YOLOv8/v11 的模型实现上传视频实时推理——完整脚本
解析了基于 YOLOv8 与 OpenCV 的实现逻辑:从依赖库导入、模型加载、视频读写,到逐帧推理、结果可视化与输出,脚本支持本地视频及摄像头流输入,参数可灵活调整以适配不同需求。YOLOv8 凭借单阶段检测优势,在速度与精度上实现平衡,相比前序版本,在小目标检测、抗复杂环境干扰、低延迟等方面提升显著。落地场景广泛,可高效应用于交通监控、工业质检、自动驾驶、安防监控等领域。原创 2025-11-18 19:54:50 · 746 阅读 · 0 评论 -
Ubuntu系统Anaconda完整安装指南
介绍了在Ubuntu系统中安装配置Anaconda的完整流程。从安装前的系统准备(更新系统、确认架构、检查空间),到Anaconda的下载安装(官网/镜像两种方式),再到安装验证和环境配置。重点讲解了如何添加国内镜像源、创建图形界面快捷方式等优化技巧,并针对conda命令未找到等6种常见错误提供了解决方案。原创 2025-11-17 21:43:48 · 1789 阅读 · 0 评论 -
YOLO11深度解析:相比YOLOv8的突破与场景升级
YOLO11作为YOLO系列的最新迭代,通过三大核心创新显著提升目标检测性能:在架构层面采用C3k2骨干网络和C2PSA颈部模块,实现参数量减少22%的同时mAP提升1.8%;训练策略引入自适应数据增强和动态优化器,使收敛速度提升30%;推理阶段通过特征筛选和算子融合技术,在RTX4090上达到120FPS推理速度。实测显示,YOLO11在COCO数据集上相较YOLOv8实现精度提升2-3%、速度提升22%,特别在小目标检测(召回率提升16.2%)和遮挡场景(漏检率降低10.5%)表现突出.原创 2025-11-16 21:19:16 · 1703 阅读 · 0 评论 -
Ubuntu系统CUDA完整安装指南
介绍了在Ubuntu系统上安装CUDA的完整流程和常见问题解决方法。安装前的硬件检查、版本匹配和nouveau驱动禁用等必要准备;提供Deb包和Run文件两种主流安装方式的详细步骤;环境变量配置建议和多版本管理方法;安装后的验证流程;总结了10类高频报错及解决方案,如下载慢、依赖缺失、驱动不匹配等问题。强调版本兼容性和前期准备的重要性,并给出详细的排错指南,帮助快速完成CUDA环境配置。原创 2025-11-16 20:56:53 · 2261 阅读 · 0 评论 -
YOLO数据集标签数量统计脚本
介绍了一个YOLO格式数据集标签统计脚本,用于分析目标检测数据集的类别分布情况。该脚本通过遍历标签文件夹中的.txt文件,统计每个类别出现的总次数,帮助开发者发现类别不平衡、标注遗漏等问题。文章详细解析了脚本的核心功能实现,包括路径处理、文件筛选、类别计数等关键步骤,并建议通过支持多子集统计和映射类别名称等扩展功能增强实用性。该工具能有效辅助评估数据集质量,为后续模型训练提供数据支撑。原创 2025-11-15 13:47:59 · 1031 阅读 · 0 评论 -
计算机视觉——图像数据增强从原理到落地的全解析
介绍了图像数据增强技术在计算机视觉中的应用。首先分析了数据增强的核心原理:通过模拟图像的自然变异生成新样本,迫使模型关注本质特征而非训练集噪声,从而提高泛化能力。将增强方法分为基础几何/像素变换、进阶局部/语义增强和任务特定增强三类,详细说明各类操作的使用场景和注意事项。提供PyTorch和TensorFlow框架下的代码实现示例,并推荐Albumentations等实用工具库。总结了常见误区,如过度增强导致语义失真、验证集误用增强等,强调应根据任务特性定制策略并进行有效性验证。原创 2025-11-14 09:42:20 · 1022 阅读 · 1 评论 -
YOLOv8轻量化改进实战——使模型更适配边缘设备
YOLOv8在边缘设备部署中存在计算瓶颈问题,针对这个问题进行轻量化改进。通过GELAN模块替换C2f结构、ECA注意力机制优化、SPPF模块改进等结构重构方法,将模型参数量减少;结合INT8量化技术使模型体积缩减;采用知识蒸馏方法让学生模型达到接近教师模型的精度水平。最终在Jetson Xavier NX等边缘设备上实现30FPS+的实时检测性能,推理速度提升数倍以上,同时精度保持不变或略有提升。原创 2025-11-12 19:59:27 · 1469 阅读 · 0 评论 -
YOLO关键点检测全流程介绍:从原理到工业落地的实战指南
YOLO关键点检测结合了目标定位与关键点识别的优势,实现了25-30FPS的实时检测和亚像素级精度。其核心在于单阶段端到端预测,通过YOLOv8-Pose等架构的三大模块(特征提取、融合、预测)同时输出边界框和关键点坐标。该技术在工业质检(如压力表读数)、人体姿态估计等场景优势显著:相比传统分割方案,YOLO速度更快(GPU达25-30FPS)、精度更高(误差≤1像素)、部署更轻量,且大幅降低标注成本。通过数据增强、迁移学习等技巧可进一步提升小关键点和遮挡场景的检测效果。原创 2025-11-11 19:29:31 · 811 阅读 · 0 评论 -
【数据集】【YOLO】【目标检测】yolo数据集,yolo视觉检测系统详细实战训练步骤!
【数据集】【YOLO】【VOC】目标检测数据集,yolo目标检测系统详细实战训练步骤!博主自己整理的数据集,包括YOLO格式数据集和Pascal VOC格式数据集,含图像原文件和标注文件,几百张到几千张不等,含有国内外图片数据。针对目标检测,YOLO系列模型训练,分类训练等。目标检测算法集研发,含有目标检测yolo完整代码,QT界面完整代码。yolo目标检测,完整标注数据集+项目代码。如需要其他数据集可留言帮忙查找,目前完整数据集目录如下文所示!原创 2024-11-07 17:18:58 · 25175 阅读 · 14 评论 -
CV三大核心任务:目标检测、图像分割、关键点检测
计算机视觉三大基础任务——目标检测、图像分割和关键点检测,构成智能系统的核心感知能力。目标检测实现"定位+识别",从R-CNN到YOLOv10持续提升实时性;图像分割完成像素级分类,U-Net、DeepLab等模型推动医疗等领域的精细识别;关键点检测则通过特征定位支持姿态分析。三大任务既独立发展又相互促进,MaskRCNN等融合模型实现性能互补。当前技术已广泛应用于自动驾驶、医疗影像等领域,未来趋势将向统一建模、多模态交互和3D感知演进,推动通用视觉智能的发展。原创 2025-11-10 18:23:59 · 1234 阅读 · 0 评论 -
从零掌握U-Net数据集训练:原理到实战的完整指南
U-Net 模型数据集训练全流程,先解析 U 型架构核心(编码器特征提取、解码器尺寸恢复、跳跃连接融细节)与小样本适配、高精度定位优势。再详解数据集选型、规范组织、批量预处理(含增强、划分)实操,提供完整 PyTorch 实现代码,涵盖模型搭建、损失函数(交叉熵 / Dice / 混合)、优化器与早停策略。搭配训练循环、TensorBoard 可视化及调优技巧,结合 Carvana 汽车分割实战。全文兼顾原理与落地,适合入门者快速上手,也为进阶开发者提供优化思路,助力高效完成图像分割任务。原创 2025-11-09 20:42:58 · 853 阅读 · 0 评论 -
YOLO11速度估算全解析:从原理到实战的完整解决方案
YOLO11的目标测速方案,通过YOLO11检测运动目标,配合ByteTrack跟踪算法获取运动轨迹,经透视变换将像素位移转换为真实距离。系统采用YOLO11m模型实现51.5mAP和4.7ms/帧推理速度,支持多种部署格式。核心包括速度估算模块(时空转换+帧率计算)、透视变换矩阵标定及可视化输出。通过推理加速(TensorRT/DeepSparse)和精度优化(卡尔曼滤波、ROI限制)提升性能,实测误差±2km/h。方案已在交通监控和工业场景验证,支持多目标实时测速。原创 2025-11-08 12:19:51 · 885 阅读 · 0 评论 -
【重要】提升yolo精度的关键技巧——迁移学习,从原理到精度突破的实战路径
YOLO11凭借C3k2并行特征提取、C2PSA注意力增强和轻量化骨干设计,成为迁移学习的理想选择。其预训练模型已学习90%通用视觉特征,迁移时仅需微调10%参数即可快速适配新场景。实践表明,YOLO11在码头安防等场景中表现优异,相比基线模型mAP提升21.4%,且能有效应对恶劣天气、小目标和遮挡等挑战。部署时可通过ONNX/TensorRT转换提升推理速度,并采用增量学习持续优化。原创 2025-11-07 10:34:49 · 1096 阅读 · 0 评论 -
YOLOv11视觉检测实战:安全距离测算全解析
YOLOv11结合单目视觉技术可实现高效安全距离监测,适用于智能交通、工业安防等场景。通过目标检测边界框像素尺寸与相机标定参数(焦距f、目标实际尺寸H),基于相似三角形原理计算距离(Z=H×f/h)。核心流程包括:相机标定、YOLOv11模型加载、距离计算及安全判定(如车辆安全阈值5米)。优化方案包括多类别尺寸库、卡尔曼滤波平滑数据及俯仰角修正。该方案成本低、部署灵活,代码可实现实时监测(30+FPS),普通场景直接复用,高精度需求可升级为双目视觉。原创 2025-11-06 10:36:45 · 983 阅读 · 0 评论 -
超详细!YOLO11 部署 RK3588 全流程:从环境搭建到摄像头实时运行
介绍了YOLO11+RK3588组合在边缘计算中的应用方案。YOLO11凭借轻量架构(5.2M参数)和优化的特征融合模块,在边缘设备上实现高效目标检测;RK3588作为国产算力板,其6TOPS NPU为YOLO11提供强力支撑。文章从硬件选型开始,逐步指导读者完成软件环境搭建、模型转换(ONNX→RKNN)、实时推理代码编写等完整部署流程,并通过剪枝、频率调节等优化手段提升性能。实测在640x640输入下可达64FPS,单帧功耗8.2W,适合安防监控、工业检测等实时场景。原创 2025-11-05 20:38:18 · 2136 阅读 · 2 评论 -
YOLOv8 卷积网络优化全攻略:从原理到实战,让模型又快又准
YOLOv8卷积网络的优化方法。首先分析其核心结构:Conv模块和C2f模块,指出普通卷积存在计算量大、特征冗余等问题。随后提出三类优化方案:轻量化方法(深度可分离卷积、分组卷积+剪枝)可降低70%计算量;特征增强方法(动态卷积、多尺度融合、空洞卷积)能提升小目标检测精度;工程化技巧(量化、层融合)可加速推理。通过平衡计算量、参数量和特征表达能力,实现模型性能的显著提升。原创 2025-11-04 17:08:19 · 930 阅读 · 0 评论 -
YOLOv8 训练结果指标全解析:从 P/R/F1 到 mAP,一文读懂模型性能
深入解析了YOLOv8模型的评估指标,帮助读者理解并优化模型性能。主要内容包括: 基础指标:详细讲解精确率(P)、召回率(R)和F1分数的定义、计算方法和应用场景,揭示它们之间的权衡关系 核心指标:重点解读目标检测的核心指标:mAP(平均精度),包括单类AP和多类mAP的计算逻辑,以及mAP@0.5与mAP@0.5:0.95的区别 实用指标:介绍损失函数、速度指标(FPS)和混淆矩阵的实际应用,指导模型调优 实战指南:提供查看指标的具体方法、常见问题解决方案和指标分析优先级,帮助原创 2025-10-31 15:58:49 · 2593 阅读 · 0 评论 -
YOLOv8 + 注意力机制实战教程:从原理到落地
这篇教程详细介绍了如何将注意力机制(SE和CBAM)集成到YOLOv8目标检测框架中,以解决小目标检测不准、复杂背景干扰等问题。文章从YOLOv8的核心结构分析入手,解释了注意力机制的工作原理,提供了SE/CBAM模块的PyTorch实现代码,并指导如何将其插入到YOLOv8的C2f模块中。教程包含完整的配置修改、训练流程和性能验证方法,同时给出了预期效果:SE注意力预计提升1-3%的mAP@0.5精度,CBAM提升更多但计算量更大。最后还总结了常见问题的解决方案和后续优化方向,为开发者提供了实用参考。原创 2025-10-29 11:54:50 · 1296 阅读 · 0 评论 -
复杂环境下视觉检测中的小目标:类型、处理与精度提升
摘要: 针对复杂环境下的小目标检测难题,分析了工业检测、安防监控、遥感图像和医疗影像四个典型场景中的小目标类型及其检测难点。提出从数据和特征两个层面增强特征区分度、减少环境干扰,并给出模型优化方案,包括轻量型网络选择、检测头设计优化和后处理改进。此外,还介绍了蒸馏学习、超分辨率重建和多模态融合等进阶技巧,为提升小目标检测精度提供可落地的解决方案。原创 2025-10-25 21:19:01 · 859 阅读 · 0 评论 -
PyTorch vs TensorFlow:从入门到落地的全方位对比
PyTorch与TensorFlow深度对比:动态图与静态图的本质差异 摘要:PyTorch和TensorFlow作为深度学习两大主流框架,在设计理念上存在根本区别。PyTorch采用动态计算图,支持即时执行和调试,适合科研探索和快速原型开发;TensorFlow基于静态图优化,在部署效率和性能方面表现突出,更适合企业级生产环境。原创 2025-10-24 17:21:56 · 914 阅读 · 0 评论 -
labelme json格式转yolo txt格式,json标注文件转txt标注文件。
labelme json格式转yolo txt格式,json标注文件转txt标注文件。在实例分割的训练任务中,使用的是 LabelMe 工具进行图像标注,标注文件是 json 格式,而 YOLO 训练则需要 txt 格式的标注文件。这篇文章提供一个脚本,可以将文件夹内的 JSON 标注文件批量转换为 YOLO 格式,并将txt文件输出到指定目录当中。原创 2025-06-26 10:24:51 · 605 阅读 · 0 评论 -
YOLO的TXT格式转Labelme的JSON格式,数据集TXT标注文件转JSON标注文件。
在实例分割的训练任务中,使用的是 LabelMe 工具进行图像标注,标注文件是 json 格式,而 YOLO 训练则需要 txt 格式的标注文件。这篇文章提供一个脚本,可以将文件夹内的 YOLO 标注文件批量转换为 JSON 格式,并将 .json 文件输出到指定目录当中。原创 2025-06-27 09:43:29 · 653 阅读 · 0 评论 -
YOLO的TXT格式转Pascal的XML格式,数据集TXT标注文件转XML标注文件
如果你的任务需要与VOC兼容的工具或数据集交互,转换就非常必要。VOC格式是许多数据格式转换的中间格式(如COCO、TFRecord等),因此可能需要先转成VOC XML,再转成其他格式。VOC格式的XML文件可以存储更多元数据(如图像尺寸、数据库来源、分割信息等),而YOLO格式仅存储类别和边界框坐标。许多标注工具(如LabelImg)可以直接打开XML文件进行可视化检查,而YOLO格式的txt文件需要额外的解析。某些预训练模型(如基于VOC训练的模型)可能需要VOC格式的标注文件进行微调或测试。原创 2025-07-02 10:33:00 · 319 阅读 · 0 评论 -
【目标检测】YOLO的TXT格式转Pascal的XML格式,数据集TXT标注文件转XML标注文件
本文介绍了将VOC格式XML标注转换为YOLO格式TXT的方法。VOC格式包含冗余信息,而YOLO格式更轻量,能提升训练效率。转换可避免坐标转换误差、统一数据格式、兼容YOLO工具链。提供了完整的Python转换脚本,包括目录设置、坐标归一化处理和文件拆分功能。脚本从XML提取目标类别和边界框信息,转换为YOLO要求的归一化相对坐标格式,并生成每张图片对应的TXT文件。原创 2025-07-03 12:08:00 · 387 阅读 · 0 评论 -
从 YOLO 到 COCO:一款实用的标注格式转换工具详解,目标检测YOLO的txt格式转COCO的json格式。
从 YOLO 到 COCO:一款实用的标注格式转换工具详解,目标检测YOLO的txt格式转COCO的json格式。在目标检测任务中,数据标注格式的统一是模型训练前的重要准备工作。YOLO 格式以其简洁直观被广泛用于标注工具(如 LabelImg、LabelStudio),而 COCO 格式则是许多主流框架(如 Detectron2、MMDetection)的标准输入格式。这个脚本可以帮助你轻松实现 YOLO 标注到 COCO 格式的转换,帮你解决数据格式不兼容的烦恼。原创 2025-09-15 20:08:02 · 433 阅读 · 0 评论 -
轻松将 YOLO 的 PT 模型转为 ONNX 格式,如何将 PT 格式模型转为 ONNX 格式模型。
轻松将 YOLO 的 PT 模型转为 ONNX 格式,如何将 PT 格式模型转为 ONNX 格式模型。训练时用的框架(比如 PyTorch)和部署时的推理引擎(比如 TensorRT、OpenVINO)格式不兼容。这时,ONNX(Open Neural Network Exchange)格式就成了 “桥梁”—— 它是一种跨框架的模型格式,几乎所有主流推理引擎都支持。如果你刚好在使用 YOLO 训练目标检测模型,这个脚本可以帮你快速把训练好的 .pt 模型转为 ONNX 格式,还自带模型验证功能。原创 2025-09-16 21:31:34 · 729 阅读 · 0 评论 -
目标检测yolo数据集,批量修改 VOC 格式标注文件标签名称,修改xml格式标注文件的标签名称
目标检测yolo数据集,批量修改 VOC 格式标注文件标签名称,修改xml格式标注文件的标签名称在目标检测任务中,VOC 格式的标注文件(XML)是非常常见的数据格式。但有时候我们可能会遇到需要统一修改标签名称的情况 —— 比如标注时不小心用了不同的名称,或者需要将某一类别的标签统一调整。这个脚本的核心功能很明确:遍历指定文件夹下的所有 XML 标注文件,将每个文件中所有object节点下的name标签内容,统一修改为我们需要的名称(示例中是rat,可根据需求调整)。原创 2025-09-18 20:11:07 · 245 阅读 · 0 评论 -
Python 实现数据集自动划分(训练集 / 验证集 / 测试集)
Python 实现数据集自动划分(训练集 / 验证集 / 测试集)在深度学习模型训练中,我们通常需要将数据集划分为训练集(Train)、验证集(Val)和测试集(Test)。训练集用于模型参数学习,验证集用于超参数调优,测试集用于评估模型最终泛化能力。手动划分不仅效率低,还难以保证随机性,这里分享一段自动划分数据集的 Python 脚本。这段代码的核心功能是:将原始数据集中的图片和对应标签,按照 8:1:1 的比例随机划分为训练集、验证集和测试集,并分别存放于对应目录中,同时保证划分结果可复现。原创 2025-09-23 11:35:57 · 812 阅读 · 0 评论 -
VOC 格式 XML 标注文件转 YOLO 格式 TXT 文件,目标检测标注格式转换
VOC 格式 XML 标注文件转 YOLO 格式 TXT 文件,目标检测标注格式转换。该代码主要实现以下功能:解析 XML 格式的标注文件,提取目标类别、边界框坐标等信息将 XML 中的边界框坐标(xmin, ymin, xmax, ymax)转换为 YOLO 格式的归一化坐标(中心 x, 中心 y, 宽,高)为每张图片生成对应的 TXT 标注文件自动复制图片到指定目录,与标注文件对应存放原创 2025-09-25 14:28:16 · 384 阅读 · 0 评论 -
yolo PT权重文件修改标签名称,推理标签英文转中文,best.pt修改推理名称
yolo PT权重文件修改标签名称,推理标签英文转中文,best.pt修改推理名称在模型部署或二次开发过程中,我们有时需要修改模型权重文件(.pt 格式)中存储的标签名称(比如将英文标签改为中文、统一标签命名规范等)。本文将通过一段简单的代码,介绍如何使用 PyTorch 实现这一需求。这段代码的核心功能是:加载 PyTorch 模型权重文件(.pt),修改模型中存储的标签名称列表,最后将修改后的权重保存为新文件。适用于需要调整模型输出标签名称的场景(例如目标检测模型的类别标签修改)。原创 2025-10-10 15:50:06 · 365 阅读 · 0 评论 -
YOLO11 训练参数详解:从基础配置到进阶优化
YOLO11 训练参数详解:从基础配置到进阶优化YOLO11 作为最新一代目标检测模型,在精度和速度上均有显著提升,而合理配置训练参数是发挥其性能的关键。本文将按基础训练、网络结构、数据增强、优化器、日志保存五大类,逐个拆解 YOLO11 训练参数,结合实际场景给出调整建议,文末附完整训练命令示例,新手也能快速上手。原创 2025-10-16 17:46:46 · 1854 阅读 · 0 评论 -
YOLO11 模型参数详解:从结构到实战,小白也能看懂
YOLO11 延续了 “速度与精度兼顾” 的核心优势,同时优化了小目标检测能力和跨场景适应性。对于刚接触 YOLO11 的开发者来说,理解参数含义是快速上手的关键 —— 本文会避开复杂公式,用 “大白话 + 实战场景” 拆解核心参数,帮你轻松调参。涉及到参数的核心分类、核心参数详解、参数选择建议、进阶调参的方法等等。原创 2025-10-22 16:22:07 · 1601 阅读 · 0 评论 -
训练好的 YOLO 模型压测指南:从指标到实战
训练好的 YOLO 模型压测指南:从指标到实战。这个模型在实际场景中能扛住多大压力? 比如摄像头实时推流时会不会卡顿?高峰期并发请求能否及时响应?这就需要通过 “压测” 来验证 —— 本文将用 “介绍 + 代码示例” 带你掌握 YOLO 模型压测的完整流程,从指标定义到工具使用,再到结果分析。用多线程和 Locust 模拟真实并发,找到性能瓶颈。根据压测结果 “对症下药”,优先解决最影响业务的指标(如实时场景先保 FPS,高并发场景先保吞吐量)。原创 2025-10-23 17:15:51 · 886 阅读 · 0 评论
分享