
计算机视觉论文阅读笔记
文章平均质量分 89
视觉论文复现以及阅读记录
一曲无痕奈何
执笔书写人生路,背包踏尽世俗事。
展开
-
PAN++: Towards Efficient and Accurate End-to-End Spotting of Arbitrarily-Shaped Text代码复现
单卡完美复现pan++论文代码结果原创 2022-11-21 21:12:56 · 1259 阅读 · 7 评论 -
ABCNet v2: Adaptive Bezier-Curve Network forReal-time End-to-end Text Spotting
ABCNet V2:用于实时端到端文本识别的自适应Bezier曲线网络摘要:旨在将检测和识别集成到统一框架中的抽象端到端文本定位由于其两个互补任务的简单性而引起了越来越多的关注。这仍然是一个悬而未决的问题,尤其是在处理任意形状的文本实例时。以前的方法可以大致分为两组: 基于字符的和基于分割的,由于非结构化的输出,它们通常需要字符级别的注释和/或复杂的后处理。在这里,我们通过呈现自适应贝塞尔曲线网络v2 (ABCNet v2) 来解决端到端文本识别问题。我们的主要贡献有四个方面: 1)...原创 2022-06-01 16:30:28 · 1736 阅读 · 1 评论 -
ByteTrack: Multi-Object Tracking by Associating Every Detection Box 论文阅读笔记()
多目标跟踪(MOT)的目的:是估计视频中物体的边界框和身份。一、以前方法怎么做的(提出的问题):通过关联分数高于一个设定的阈值的检测框来得到身份特征,但是检测分数较低的,或者被遮挡的,运动模糊的,都会被简单的剔除,这样就会导致问题:真实物体的缺失,碎片轨迹化。二、本文论文如何解决这个问题的:提出了一种简单、有效、通用的关联方法,通过将几乎每个检测框关联起来,而不是只将高分的检测框进行跟踪。解决问题流程:对于低分数的检测框,利用与轨迹的相似性来恢复真实的图像,并且过滤掉背景。本文应原创 2022-05-22 16:07:12 · 1405 阅读 · 0 评论