Point2RBox, 点直接生成旋转框, 代码已集成至mmrotate | CVPR 2024

最新推荐文章于 2025-12-04 13:49:48 发布

原创

最新推荐文章于 2025-12-04 13:49:48 发布 · 1.3k 阅读

CC 4.0 BY-SA版权

文章标签：

论文介绍

题目：Point2RBox: Combine Knowledge from Synthetic Visual Patterns for End-to-end Oriented Object Detection with Single Point Supervision

会议：2024 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)

基于合成图案的知识组合：通过在原始图像上叠加合成的视觉图案，来模拟具有明确尺寸和方向的目标，从而帮助模型学习如何从一个单独的点出发，推断出目标的具体形状、大小和方向。这个过程允许模型从非常有限的监督中学习框的回归。
基于变换的自监督：通过强制模型学习图像变换（翻转、旋转和缩放）后目标的一致性表征，提高模型对目标尺寸、位置和方向估计的准确性和鲁棒性。
端到端框架：Point2RBox是点监督的端到端解决方案，与先将点注释转换为水平框(HBox)或掩膜(Mask)然后再转换为RBox的两步方法形成对比。这种直接方法既创新又节省计算资源。