基础---目标检测小记

最新推荐文章于 2024-03-24 16:16:52 发布

雁飞鸣

最新推荐文章于 2024-03-24 16:16:52 发布

阅读量418

点赞数

本文链接：https://blog.youkuaiyun.com/weixin_41447373/article/details/111304408

版权

用来表达bbox的格式通常有两种，(x1, y1, x2, y2) 和 (c_x, c_y, w, h) ，如图3-3所示：

之所以使用两种不同的目标框信息表达格式，是因为两种格式会分别在后续不同场景下更加便于计算。

两种格式互相转换的实现：

def xy_to_cxcy(xy):
    """
    Convert bounding boxes from boundary coordinates (x_min, y_min, x_max, y_max) to center-size coordinates (c_x, c_y, w, h).

    :param xy: bounding boxes in boundary coordinates, a tensor of size (n_boxes, 4)
    :return: bounding boxes in center-size coordinates, a tensor of size (n_boxes, 4)
    """
    return torch.cat([(xy[:, 2:] + xy[:, :2]) / 2,  # c_x, c_y
                      xy[:, 2:] - xy[:, :2]], 1)  # w, h


def cxcy_to_xy(cxcy):
    """
    Convert bounding boxes from center-size coordinates (c_x, c_y, w, h) to boundary coordinates (x_min, y_min, x_max, y_max

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

雁飞鸣

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

bbox的各种格式转换（detectron2函数库）

G果的博客

02-15

4828

参考网址：classdetectron2.structures.BoxMode(value)

常见的目标检测bbox标注格式

最新发布

Closure

04-11

719

并进行数据规范化(normalized)Pasic VOC 转 YOLO。COCO 转 YOLO。格式：中心坐标，宽高。

参与评论您还未登录，请先登录后发表或查看评论

计算机视觉——bbox的格式简介

Williamcsj的博客

03-15

1万+

计算机视觉——bbox的格式简介一、Itwh二、xywh 前提知识：左上角为坐标原点一、Itwh 全程：(left，top，weight，height) 二、xywh 全程：(x，y，weight，height) x、y既可以指左上角的点也可以指中心点 coco数据集： [x,y,w,h]，分别表示的是左上角横坐标、左上角纵坐标、宽度、高度 yolo数据集： [x,y,w,h]，分别表示的是中心点横坐标、中心点纵坐标、宽度、高度 ...

第一次打卡

weixin_50676798的博客

12-16

253

第一次打卡 3.1目标检测 3.1.1 什么是目标检测 目标检测是计算机视觉中的一个重要任务，近年来传统目标检测方法已经难以满足人们对目标检测效果的要求，随着深度学习在计算机视觉任务上取得的巨大进展，目前基于深度学习的目标检测算法已经成为主流。相比较于基于深度学习的图像分类任务，目标检测任务更具难度。具体区别如图3-1所示。图像分类：只需要判断输入的图像中是否包含感兴趣物体。 目标检测：需要在识别出图片中目标类别的基础上，还要精确定位到目标的具体位置，并用外接矩形框标出。图3-1 分类和目

[python]常见的bbox标注格式

FL1768317420的博客

03-24

875

在图像上标记目标的矩形(bounding box, bbox)。常见的标注格式为Pascal VOC、COCO、YOLO。

深度学习(目标跟踪和目标检测)--边界框bbox坐标转换(任意格式【list,numpy,tensor】、任意维度【向量、一维矩阵、二维矩阵】)

weixin_50727642的博客

01-28

3201

作者提示：可能存在错误，在我的电脑上可以运行；写程序过程中发现不同的人写的边界框转换程序不一样，有的只能转换numpy矩阵，有的只能是转换tensor矩阵，我就尝试着写了一个可以转换任何维度的任意格式的bbox函数。水平不够，写的时候用的时间长了，脑袋就有些晕乎乎的，就发出来希望大家一起发现其中的错误，也方便大家使用；如果朋友们发现程序有问题，希望可以及时指出，我会立马做出修改，共同进步。本程序目的是：可以转换以下三种格式的输入数据 list,numpy,tensor，维度可以从0维到2维，

机器学习小记-决策树

qq_40140808的博客

06-29

382

决策树是一种常见的机器学习算法，用于分类和回归问题。它基于一系列的决策规则来对数据进行划分，最终形成一个树状结构。每个内部节点代表一个特征，每个分支代表该特征的一个取值，而每个叶节点代表一个类别（对于分类问题）或一个数值（对于回归问题）。决策树的构建过程包括以下步骤：特征选择：根据某种准则选择最佳的特征作为当前节点的划分依据。常见的特征选择准则包括信息增益、信息增益比、基尼系数等。节点划分：根据选择的特征，将数据集划分为不同的子集。每个子集对应于一个分支，构成当前节点的子节点。

USC行人数据集---

03-07

研究人员可能会利用这个数据集来改进现有算法，例如解决在复杂背景、小目标或者快速移动情况下的行人检测难题。数据集的可用性促进了学术界和工业界的交流，推动了行人检测领域的技术进步。在进行行人检测研究时，...

初探Mach-O学习小记(附源码)

fishmai的专栏

05-15

2572

近来在学习osx和ios方面的东西，简单熟悉了下oc的语法后打算学习下osx和ios下的文件格式。 -------------------------------------------------------------------------------------------- Header部分结构体定义在mach-o/loader.h头文件中代码: struc

Raki的读paper小记：Image as a Foreign Language: BEIT Pretraining for All Vision and Vision-Language Tasks

Raki_J的博客

09-02

1547

在视觉任务上，可惜没看到NLP那边杀起来。

一文看懂DETR（三）

litt1e的博客

09-04

796

1.输入图像经过CNN的backbone获得32倍下采样的深度特征；2.将图片给拉直形成token，并添加位置编码送入encoder中；3.将encoder的输出以及Object Query作为decoder的输入得到解码特征；4.将解码后的特征传入FFN得到预测特征；5.根据预测特征计算cost matrix，并由匈牙利算法匹配GT，获得正负样本；6.根据正负样本计算分类与回归loss。前两章，我们分析了训练步骤的1，2，3。

目标检测yolo, voc, coco的BBox格式转换

fwu11的博客

01-17

5307

目标检测yolo, voc, coco的BBox格式转换

YOLOF

qq_43431934的博客

11-03

2670

YOLOF YOLOF 全称是You Only Look One-level Feature, 其通过详细的实验指出特征金字塔 FPN 模块的成功在于其对目标优化问题的分治解决方案，而不是我们常说的多尺度特征融合。针对该结论，设计了一个简洁优雅的无需复杂 FPN 的网络结构，仅仅依靠单尺度特征即可取得相匹配的效果，并且具备极快的推理速度，是一个不错的算法。文中讨论FPN成功在于分而治之而不是特征融合。文中从另一个角度解决这个问题，只使用一层的特征信息。文中有两个主要因素: 扩张encoder、统一匹.

将COCO2017标注文件中的bbox显示在图片上

追随梦想，实现梦想

11-21

1万+

from pycocotools.coco import COCO import cv2 import pandas as pd def showNimages(imageidFile, annFile, imageFile, resultFile): """ :param imageidFile: 要查看的图片imageid，存储一列在csv文件里（目前设计的ima...

matplotlib8 -- 文字注释进一步详解 bbox参数，箭头形状等

热门推荐

墨流觞的博客

11-27

1万+

在matplotlib7中说明了，除了描述箭头属性的参数，其余传入annotate函数的参数，豆浆解释为text的属性参数。 1. text的bbox属性以及其他的属性描述Text的属性，包括颜色，字体大小，字体类型等 matplotlib.text.Text 着重讲述一下字典属性bbox 简单的说就是在用不同的矩形框将文字框起来，并用一系列属性来定义矩形框的 boxstyle ：矩形框的...

目标检测数据增强：截取出bbox（VOC数据格式）

winnerziqi的博客

03-06

627

截取出bbox（VOC数据格式） import os import cv2 import utils try: import xml.etree.cElementTree as ET # 解析xml的c语言版的模块 except ImportError: import xml.etree.ElementTree as ET img_path = r"D:\Catalogue\master\generate_data\mitios_withxml\VOCdevkit2007\VOC2007

YOLOF 速度和效果均超过YOLOv4的检测模型

jacke121的专栏

06-08

2276

YOLOF 全称是You Only Look One-level Feature, 其通过详细的实验指出特征金字塔 FPN 模块的成功在于其对目标优化问题的分治解决方案，而不是我们常说的多尺度特征融合。针对该结论，设计了一个简洁优雅的无需复杂 FPN 的网络结构，仅仅依靠单尺度特征即可取得相匹配的效果，并且具备极快的推理速度，是一个不错的算法。 YOLOF 论文核心可以总结如下：设计了多组实验，深入探讨了 FPN 模块成功的主要因素基于实验结论，设计了无需 FPN 模块，单尺度简...

目标检测入门——01目标检测概念及数据集

m0_47024418的博客

12-16

1673

目标检测入门——01目标检测概念及数据集 1. 目标检测 1.1目标检测是什么在入门阶段，大家经常会混淆分类任务和检测任务。分类任务是要明确图中是什么（属于哪一类，比如是猫还是狗），检测任务是要明确图中有什么，在什么位置，需要用目标框框出来，是在分类任务上进一步的任务。如下图，检测出图片中是一只猫不是一只狗，就是分类任务。下面这张图，检测出图片中是一只猫并框出猫的位置，就属于检测任务。 2.目标检测的原理 2.1目标检测的基本原理对于给出的图片，采用滑动窗口的方式，按照一定的顺序遍历图片中的各个

动手学深度学习 - 9.3. 目标检测和边界框

程永强

06-22

1870

动手学深度学习 - 9.3. 目标检测和边界框动手学深度学习 - Dive into Deep Learning Aston Zhang, Zachary C. Lipton, Mu Li, and Alexander J. Smola https://zh.d2l.ai/ 9.3. 目标检测和边界框在图像分类任务里，我们假设图像里只有一个主体目标，并关注如何识别该目标的类别。然而，很多时候图像里有多个我们感兴趣的目标，我们不仅想知道它们的类别，还想得到它们在图像中的具体位置。在计算机视觉里，我们将这类