
OT论文解读
文章平均质量分 90
主打的就是一个论文和代码解读
Soonki
这个作者很懒,什么都没留下…
展开
-
OSTrack: Joint Feature Learning and Relation Modeling for Tracking: A One-Stream Framework论文和代码结构解读
OSTrack和ODTrack代码结构和内容基本一致,主要是采样方法有所区别代码中使用了很多CE的前缀,比如,vit_ce、ce_block等,这就是单纯的使用了candidate_elimination模块,所以会加一个ce前缀。原创 2024-07-13 16:28:05 · 1001 阅读 · 0 评论 -
ODTrack: Online Dense Temporal Token Learning for Visual Tracking论文及代码结构解读
代码中使用了很多CE的前缀,比如,vit_ce、ce_block等,这就是单纯的使用了candidate_elimination模块,所以会加一个ce前缀。原创 2024-07-12 21:56:23 · 1420 阅读 · 0 评论 -
GRM: Generalized Relation Modeling for Transformer Tracking论文模型及代码结构解读
如图所示,search和template分支是独立两根流线,提取特征后计算互相关信息,也是最常用的,缺点是提取的特征缺乏目标的感知性,对目标-背景的区分能力有限,两个patch之间信息交互度较差。原创 2024-06-19 15:49:32 · 885 阅读 · 0 评论 -
STARK:Learning Spatio-Temporal Transformer for Visual Tracking论文及代码结构解读
什么是One-stream和Two-stream,参考文章。原创 2024-06-24 16:55:32 · 755 阅读 · 0 评论 -
FeatUp: A Model-Agnostic Framework for Features at Any Resolution论文和代码结构解读
FeatUp从任意图像特征中进行上采样,给现有的语义信息中增加空间分辨率。可学习的高分特征可以作为图片的隐式网络或者通用的上采样操作,而这种操作就是一个即插即用的模块,用于改善下游的密集型预测任务。原创 2024-06-19 17:54:54 · 1137 阅读 · 3 评论 -
AiATrack: Attention in Attention for Transformer Visual Tracking模型及代码结构解读
典型的Transformer跟踪框架中,通过自注意力模块增强参考帧和搜索帧的特征表示,并通过交叉注意力模块桥接它们之间的相关性,以在搜索帧中预测目标。作者引入了AiA(Attention in Attention)模块,字面意思,就是在一个Attention中,再引入一个Attention,并把该模块作为Encoder和Decoder的basis。,但是令人费解的是,这么庞大的网络结构,这么多的参数,在一个2080Ti显卡上居然能有38FPs。作者引入的AiA模块,就是基于。原创 2024-03-13 16:17:24 · 1202 阅读 · 0 评论 -
UniRepLKNet: Universal Perception Large-Kernel ConvNet模型结构和代码结构解读
UniRepLKNet: Universal Perception Large-Kernel ConvNet原创 2024-03-06 17:04:26 · 1155 阅读 · 0 评论 -
SiamSE: Scale Equivariance Improves Siamese Tracking论文和代码解读
结果依赖于所选的规范,但是对于各个规范都是等价的,例如对向量场进行变换,输出的向量场也会产生对应变换;对Kg的质量场进行变换,则以斤为单位的质量场也会变换。也就是说template和search进行相似度计算后,数值最大的地方是目标所在地,而数值非常小的是背景(已经经过了softmax)。是标准做法,这样可以有效保存图像的空间信息,但是补零的话,会让卷积追踪器的定位属性裂化。当且仅当在规范卷积的情况下,追踪器对于规范群的变换也是等变的。,这种特性和相似特征的正交性是非常符合的。是规范等变卷积层构成的,原创 2023-06-26 21:59:48 · 271 阅读 · 0 评论 -
Rotation Equivariant Networks for Tracking论文解读
1. IntroductionThe task of visual object tracking with Siamese networks, referred as Siamese tracking, transforms the problem of tracking into similarity estimation between a template frame and sampled region from a candidate frame.孪生网络是把追踪任务描述成templat原创 2023-06-16 19:37:37 · 351 阅读 · 0 评论 -
Learning to Fuse Asymmetric Feature Maps in Siamese Trackers论文解读
实际上根本没有。原创 2023-06-15 16:34:15 · 244 阅读 · 0 评论 -
E2CNN: General E(2)-Equivariant Steerable CNNs论文解读
齐次空间与齐次坐标 Homogeneous Sapce and Homogeneous Coordination∙\bullet∙齐次坐标 Homogeneous Coordination\qquad齐次坐标本质上是4D向量(x,y,z,w)(x, y, z, w)(x,y,z,w), 在w=1w=1w=1处的三维空间定义为标准的3D空间,任何齐次坐标转化到标准3D空间坐标点为(xw,yw,zw)(\frac{x}{w},\frac{y}{w},\frac{z}{w})(wx,wy,wz),原创 2023-06-14 20:18:51 · 1818 阅读 · 0 评论 -
SiamRN:Learning to Filter: Siamese Relation Network for Robust Tracking模型结构和代码解读
利用Head产生的cls和loc作用于特征图xf和原图x,产生新的特征图和gt,然后放入Relation Detector中,训练一个加权矩阵(或者说:过滤?Relation Detector的结果直接乘上用来Classify的feature(就是Xcorr),就是加权了。这里放上代码结构图,同时也是SiamRN网络结构图,基本上看这个可以达到复现的效果。个点的矩阵,包含了正样本1(16个),负样本0(48个),忽略样本 -1(外面的所有点都是负样本点,而大椭圆。(没用到)有什么区别。原创 2023-06-07 22:43:22 · 552 阅读 · 3 评论 -
关于DIMP:Learning Discriminative Model Prediction for Tracking的Pipeline的理解
DIMP: Learning Discriminative Model Prediction for Tracking原创 2023-03-12 20:33:38 · 376 阅读 · 0 评论 -
Segment Anything模型结构解读
论文地址代码下载官网关于Segment Anything的理解1.人工标注过程使用公开数据集训练,并且让人工标注团队进行标注预测的mask,该过程总共进行6次,并产生430万个mask2.半自动标注过程模型产生的置信度相对较高的mask,不需要人工标注,而置信度相对不高的mask,由人工完成标注。举个例子,模型分割一张图片,总共产生了10个mask,其中有5个分割得很好,这部分就作为自动标注的mask,另外5个效果不好,就进行人工标注。该过程总共进行5次,产生590万个mask3.全自动过程原创 2023-04-24 21:11:58 · 18011 阅读 · 3 评论 -
关于ATOM:Accurate Tracking by Overlap Maximization的Pipeline的理解
ATOM:Accurate Tracking by Overlap Maximization文章参考:https://arxiv.org/abs/1811.07628原创 2023-03-10 22:50:00 · 359 阅读 · 1 评论