
目标检测和跟踪
文章平均质量分 62
分享目标检测和跟踪相关的前沿知识。
leo0308
AI攻城狮
展开
-
详解相机的内参和外参,以及内外参的标定方法
首先空间中的一点由世界坐标系转换到相机坐标系 ,然后再将其投影到物理成像平面 ( 成像平面坐标系 ) ,最后再将成像平面上的数据转换像素坐标系。相机内参表达的就是这三个坐标之间的转换关系, 而相机外参表达的是相机与世界坐标系之间的转换关系。常用求解PnP 的方法,即已知多个点, 在像素坐标系的二维坐标, 和在世界坐标系的三维坐标,并且已知内参, 求解旋转平移矩阵。外参标定的核心是:已知多个点分别在相机坐标系下的坐标和在世界坐标系下的坐标, 求它们之间的映射关系。, 在相机坐标系下的坐标为。原创 2025-04-02 20:52:49 · 1423 阅读 · 0 评论 -
带旋转的目标标注工具-X-AnyLabeling
对于2D目标检测标注, 上面的工具只能标注不带旋转的检测框。但是如果我们要进行带旋转方向的检测(OBB), 就需要标注带旋转的数据, 这个时候可以使用X-AnyLabeling 这款工具。原创 2025-03-19 20:05:37 · 516 阅读 · 0 评论 -
智能标注工具 T-Rex Label
该工具可以进行自动化标注, 只需框选出一个标记, 就可以自动标注出图片中所有的其他同类物体。支持到处YOLO 和COCO格式。首先使用智能标注, 可以标注出大部分的物体, 如果有错的或者漏的, 可以删除, 也可以使用矩形框工具进行手动增加。原创 2025-03-10 19:49:27 · 336 阅读 · 0 评论 -
DINO, Grounding DINO, DINO-X系列工作解读
有2个版本的模型, 分别是Pro和Edge, Pro主打效果好, Edge版本主打高性能, 牺牲了一定的效果。把闭集检测器划分为3个阶段, 并且在3个阶段都进行了融合, 包括特征增强, 语言引导的查询选择 和交叉模态的编码器。这也是区别其他方法的地方, 其他方法一般在1-2个阶段进行融合。DINO-X 具备了基础的目标级别的表征能力, 可以支持多种目标感知和理解的任务, 比如检测, 分割, 姿态估计, 问答等等。DINO 的主要贡献是在之前的DETR系列工作上提出了3点改进, 从而提升了模型的性能和效率。原创 2025-03-05 20:00:38 · 1275 阅读 · 0 评论 -
目标检测,语义分割标注工具--labelimg labelme
labelimg可以用来标注目标检测的数据集, 提供多种格式的输入, 如Pascal Voc, YOLO等。原创 2024-12-28 23:30:40 · 1108 阅读 · 0 评论 -
coco数据集中的80个类别
【代码】coco数据集中的80个类别。原创 2024-12-28 11:21:20 · 298 阅读 · 0 评论 -
相机标定板生成
可以生成多种样式的棋盘格, 大小, 行列数也都可以设置, 非常方便。另外推荐结合相机标定程序使用, 效果更佳!原创 2024-08-28 18:45:32 · 403 阅读 · 0 评论 -
目标检测网络YOLO进化之旅
其中v5和v8 版本由Ultralytics 公司出品, 该公司是领先的人工智能公司,以yolov5网络出名。该项目在github上获得了极高的关注, 获得了接近4.7万star。YOLO的前3个版本是由同一个作者团队出品, 算是官方版本。之后的版本都是各个研究团队自己改进的版本, 之间并无明显的继承关系。yolo系列网络在目标检测领域取得了巨大的成功, 尤其是在工程实践中, 以其出色的性能优势获得了广泛的应用落地。原创 2024-04-21 12:12:13 · 477 阅读 · 0 评论 -
目标检测综述
按照stage划分, 主要可以分为one-stage 和two-stage 算法。近年来, 随着transformer的流行, 基于transformer的检测算法取得了令人惊叹的效果。2D图像的目标检测是深度学习的热门领域, 在学术研究领域取得了巨大的进展,在工程中也被广泛应用。下图中画出了3类主要算法的进化树, 方便对检测算法的脉络更好地了解。原创 2024-04-20 20:10:44 · 373 阅读 · 0 评论 -
目标跟踪算法SORT和Deep SORT详解
在SORT进行目标跟踪之前,首先通过目标检测算法得到每一帧的目标检测结果,检测结果包含bbox。当然也可以在线检测, 也就是边检测, 边进行目标跟踪,但检测本身与SORT无关。这里为了讲解方便, 先得到所有帧的检测结果。1 从第一帧图像开始, 假设该帧图像中有m个目标, 每个目标用一个bbox表示, bbox包含[x, y, w, h, c]5个值。执行卡尔曼滤波的predict过程, 得到m个目标的先验预测。3 匹配结果作为观测值,执行卡尔曼滤波的update过程, 得到目标bbox的后验估计结果。原创 2023-08-24 23:36:19 · 555 阅读 · 0 评论 -
深入理解mAP
目标检测中mAP指标深入理解。原创 2023-07-30 22:58:43 · 245 阅读 · 0 评论 -
计算机视觉常用数据集介绍
计算机视觉领域常用数据集总结。原创 2023-07-30 18:22:20 · 764 阅读 · 0 评论 -
检测中anchors与GT的匹配方法
0 引言在anchor-based的检测方法的训练过程中, 有一个重要问题就是需要根据anchors与GT(ground truth,真实的目标框)的匹配来确定正负样本。 有了正负样本, 就可以计算loss了。 anchors与GT的匹配可以有很多不同的策略, 一个简单且常用的策略是直接根据anchor框与GT的IoU来判断。具体的策略是:anchors与GT的IoU大于一定的阈值, 则这个anchor是正样本, 如果某个anchor与多个GT的IoU都大于阈值, 取具有最大IoU的GT作为labe原创 2022-05-11 00:04:56 · 1457 阅读 · 0 评论 -
检测网络中的RPN(Region Proposal Network)理解
0 引言目标检测包含2个基本问题:分类和定位。 分类比较好做, 分类任务是深度学习解决的最好的一类任务。 定位则要困难一些,最简单的方式是通过滑窗, 窗口滑动到某个位置也就完成了定位, 然后通过分类判断窗口内有无目标以及是什么目标即可。 但这个方法显然太简单粗暴, 会存在2个问题:1)滑窗要想覆盖所有目标, 窗口必须足够密, 这就导致计算量非常大, 且大多数窗口是不包含目标的, 计算非常浪费;2)窗口的尺度很难确定, 不同目标具有不同的尺度, 要想覆盖的全,窗口尺度也必须足够丰富。总之, 滑动窗口的原创 2022-05-06 22:36:51 · 4804 阅读 · 5 评论