
鱼眼行人检测
文章平均质量分 83
不知道叫啥好一点
这个作者很懒,什么都没留下…
展开
-
旋转框resize中存在的问题
旋转框采用的表示方式为:(a)长边表示法longside format: x_c y_c longside shortside Θ参数介绍:x_c与y_c:旋转矩形框的中心坐标;longside: 顾名思义,最长的边;shortside:与longside对应的另一条边;Θ: 最长边到x轴逆时针旋转的夹角,逆时针方向角度为负 ,Θ∈[-180, 0)。经过然后对图片进行resize之后,边界框的位置发生了变换,不能够同原始图像对应上,下面.原创 2022-01-14 17:05:11 · 2276 阅读 · 1 评论 -
TransTrack: Multiple Object Tracking with Transformer论文阅读笔记
(一) Title论文地址:https://arxiv.org/abs/2012.15460代码地址:https://github.com/PeizeSun/TransTrack前言: 本文建立了一种novel joint-detection-and-tracking模型,在一个框架中完成目标检测和跟踪。这是首篇将Transformer引入到MOT任务中(二) Summary研究背景目前MOT中主要有两种方式:tracking-by-detection以及joint-detection-an原创 2021-11-30 16:02:47 · 3705 阅读 · 3 评论 -
Oriented Object Detection with Transformer阅读笔记
(一) Title前言: 本文没有开源,但是最近我有实现一个基于Transformer的Detector的想法,因此还是决定看下这个论文,然后再基于DETR构建一个基于Transformer的旋转框目标检测方法,怎么说呢?公式里的每一个符号我都能看懂,但是合到一起就看不懂了,而且看完这个论文的感受很不好,有太多疑问了,希望之后能够开源代码吧。论文地址:https://arxiv.org/abs/2106.03146代码地址:没开源(二) Summary背景DETR相比于传统的detector原创 2021-11-19 17:24:17 · 3452 阅读 · 0 评论 -
MOTR: End-to-End Multiple-Object Tracking with TRansformer阅读笔记
(一) Title论文地址:https://arxiv.org/abs/2105.03247代码地址:https://github.com/megvii-model/MOTR前言:最近有幸看了几篇MOT的工作,感觉目前MOT的工作有一些集中将循环神经网络引入来构建对轨迹的预测,从而实现对遮挡情况的处理,提升性能。然而我自己没有仔细研读过Transformer相关的论文,希望以此为契机,开启循环神经网络在视觉领域的研究。(二) Summary当前存在的问题:多目标跟踪任务之前的做法中,往往是基原创 2021-11-17 20:00:27 · 4231 阅读 · 1 评论 -
Alpha-Refine: Boosting Tracking Performance by Precise Bounding Box Estimation速读笔记
(一)Title前言: 准备开启跟踪的工作了,再不做就毕不了业了,先做文献阅读啦拉啦,欧耶!就是干!论文地址:https://arxiv.org/abs/2007.02024代码地址: https://github.com/MasterBin-IIAU/AlphaRefine关键点:multiple base trackers(二) Summary研究现状及问题:最近的trackers采用multiple-stage strategy来改善边界框estimation,这些方法首先粗略地原创 2021-07-01 22:41:39 · 1255 阅读 · 2 评论 -
鱼眼图像(fisheye image)通过几何变换形成透视图(a perspective view)[存疑]
我看的论文是:Efficient Pedestrian Detection in Top-View Fisheye Images Using Compositions of Perspective View Patches我先把论文原文放上去:这里首先说的在相机坐标系(这儿我自己理解成相机坐标系)下是物体点入射光线和鱼眼图像上的投影点之间的对应关系:θ=θ0RR0\theta=\theta_{0} \frac{R}{R_{0}}θ=θ0R0R这个可以参考我的另一篇博客中的内容然后原创 2020-11-13 16:27:07 · 1170 阅读 · 0 评论 -
中心透视投影和鱼眼投影的区别(Central perspective projection vs. fisheye projection)
前言panoramic images(全景图像)以及Fisheye图像都不满足中心透视投影(Central perspective projection),不能使用collinearity equation(共线性方程)中心透视投影其中中心透视投影数学模型建立的假设是:物体点入射线和光轴的夹角和在像平面上的成像点和光轴的夹角相同,如上图所示鱼眼透视投影鱼眼图像希望在有限的平面内获取更大的视角(几乎接近90度),然而按照中心透视投影的假设来说,在像平面上的像点会位于无穷远的地方,因此,我们需原创 2020-11-12 21:40:59 · 1585 阅读 · 0 评论 -
世界坐标系、相机坐标系、图像坐标系、像素坐标系都是什么?
四个坐标系都是什么?图像处理、立体视觉等等方向常常涉及到四个坐标系:世界坐标系、相机坐标系、图像坐标系、像素坐标系构建世界坐标系只是为了更好的描述相机的位置在哪里,在双目视觉中一般将世界坐标系原点定在左相机或者右相机或者二者X轴方向的中点。接下来的重点,就是关于这几个坐标系的转换。也就是说,一个现实中的物体是如何在图像中成像的。四个坐标系之间的相互转换从世界坐标系到相机坐标系 其中[x′,y′][x^{'},y^{'}][x′,y′]为世界坐标系下的坐标,将世界坐标系顺时针旋转θ\th原创 2020-11-12 15:19:08 · 2215 阅读 · 0 评论