论文介绍
题目:Point2RBox: Combine Knowledge from Synthetic Visual Patterns for End-to-end Oriented Object Detection with Single Point Supervision
会议:2024 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)
论文:http://arxiv.org/abs/2311.14758
代码:https://github.com/yuyi1005/point2rbox-mmrotate

创新点
-
基于合成图案的知识组合:通过在原始图像上叠加合成的视觉图案,来模拟具有明确尺寸和方向的目标,从而帮助模型学习如何从一个单独的点出发,推断出目标的具体形状、大小和方向。这个过程允许模型从非常有限的监督中学习框的回归。
-
基于变换的自监督:通过强制模型学习图像变换(翻转、旋转和缩放)后目标的一致性表征,提高模型对目标尺寸、位置和方向估计的准确性和鲁棒性。
-
端到端框架:Point2RBox是点监督的端到端解决方案,与先将点注释转换为水平框(HBox)或掩膜(Mask)然后再转换为RBox的两步方法形成对比。这种直接方法既创新又节省计算资源。

区别于现有的两种“Point-to-RBox”的方式:
-
Point-to-HBox-to-RBox
简单的结合P2B和H2RBOX两种算法,缺点是可能带来累积误差,即把P2B结果作为了真值。

最低0.47元/天 解锁文章
1447

被折叠的 条评论
为什么被折叠?



