
学习日常
文章平均质量分 62
听我的错不了
江湖再见。
展开
-
happy day
like,peace,love forever.原创 2021-10-03 14:46:18 · 245 阅读 · 0 评论 -
今天学习的poc(proof of concept 和 prototypes)的概念
What Does Proof of Concept (POC) Mean?A proof of concept (POC) is a demonstration to verify that certain concepts or theories have the potential for real-world application. In a nutshell, a POC represents the evidence demonstrating that a project or produ原创 2021-09-22 20:04:09 · 4115 阅读 · 1 评论 -
LightTrack: Finding Lightweight Neural Networks for Object Tracking via One-Shot Architecture Search
Abstract目标跟踪在过去几年中取得了重大进展。然而,最先进的跟踪器变得越来越复杂和昂贵,这限制了它们在资源受限的应用程序中的部署。 在这项工作中,我们提出了LightTrack,它使用神经结构搜索(NAS)来设计更轻量和高效的对象跟踪器。综合实验表明,该方法是有效的。它可以找到性能优于手工制作的SOTA跟踪器,如siamrpn++[30]和Ocean[56],同时使用更少的模型Flops和参数。此外,当部署在资源受限的移动芯片组上时,所发现的追踪器运行速度要快得多。例如,在Snapdragon 84原创 2021-05-21 18:00:35 · 2170 阅读 · 6 评论 -
<Learning Spatio-Temporal Transformer for Visual Tracking>--阅读理解-cvpr2021
摘要在本文中,我们提出了一种新的跟踪架构,其中的编码器-解码器transformer为关键组件。 编码器对目标对象和搜索区域之间的全局时空特征相关性进行建模,而解码器学习嵌入的查询以预测目标对象的空间位置。 我们的方法将目标跟踪转换为直接边界框预测问题,而无需使用任何建议或预定义锚。 使用编解码器变压器,对象的预测仅使用简单的全卷积网络,该网络可以直接估计对象的拐角。 整个方法是端到端的,不需要任何余弦窗口和边界框平滑之类的后处理步骤,从而大大简化了现有的跟踪管道。 拟议的跟踪器在五个具有挑战性的短期和长原创 2021-04-11 10:51:18 · 2007 阅读 · 0 评论 -
恶补tranformer(一)--cv,在看代码,后期补
transformer:https://zhuanlan.zhihu.com/p/62397974https://zhuanlan.zhihu.com/p/44731789原创 2021-04-06 19:12:14 · 308 阅读 · 1 评论 -
完全二分图
G = <V,E>V – 》 元素顶点集E --》 连线边集V = X ∪YX中的任一顶点与Y中每一个顶点均有且仅有唯一的一条边相连,则称G为完全二分图或完全偶图。原创 2021-03-01 19:45:55 · 2604 阅读 · 0 评论 -
Alpha-Refine: Boosting Tracking Performance by Precise Bounding Box Estimation--精度翻译cvpr21
Abstract视觉对象跟踪的目的是精确估计给定目标的边界框,由于诸如变形和遮挡等因素,这是一个具有挑战性的问题。 许多最新的跟踪器采用多阶段跟踪策略来提高边界框估计的质量。 这些方法首先粗略地定位目标获取,然后在接下来的阶段中完善初始预测。 但是,现有的方法仍然受限于精度,而且不同阶段的耦合严重限制了该方法的可移植性。 这项工作提出了一种新颖,灵活,准确的细化模块,称为Alpha-Refine,可以显着提高基本跟踪器的预测质量。 通过探索一系列设计方案,我们得出结论,成功进行精炼的关键在于尽可能多地提取原创 2020-12-16 21:28:33 · 3492 阅读 · 4 评论 -
Deep Learning for Visual Tracking: A Comprehensive Survey(单目标跟踪目前最好的综述类文章)
Deep Learning for Visual Tracking: A Comprehensive Surveyhttps://arxiv.org/pdf/1912.00535.pdf原创 2020-12-02 10:26:47 · 1246 阅读 · 0 评论 -
SimSIam:凯明大神最新文章,消除表征学习“崩溃解”,说明孪生网络的有效性
11原创 2020-11-25 08:37:47 · 910 阅读 · 0 评论 -
cv中的注意力机制论文:CBAM and BAM 阅读理解
Abstract我们提出了卷积-块-注意力-模块(CBAM),这是一种用于前馈卷积神经网络的简单而有效的注意力模块。 给定一个中间特征图,我们的模块会沿着两个独立的维度(通道和空间)依次推断注意力图,然后将注意力图与输入特征图相乘以进行自适应特征细化。 由于CBAM是轻量级的通用模块,因此可以将其无缝集成到任何CNN架构中,而开销却可以忽略不计,并且可以与基础CNN一起进行端到端训练。 我们通过在ImageNet-1K,MS COCO检测和VOC 2007检测数据集上进行的广泛实验来验证CBAM。我们的原创 2020-11-24 20:15:07 · 5128 阅读 · 0 评论 -
MAST: A Memory-Augmented Self-Supervised Tracker
Abstract最近对自监督密集跟踪的兴趣已经取得了迅速的进展,但是性能仍然离监督方法还有很远的一段路要走。 我们提出了一种基于无注释视频训练的密集跟踪模型,该模型在现有基准上比以往的自监督方法有很大的提高(+15%),并且取得了与监督方法相当的性能。在本文中,我们首先通过深入的实验重新评估了用于自我监督训练和重建损失的传统选择,最后阐明了最优选择。 其次,我们通过使用一个关键的内存组件来增强我们的体系结构,从而进一步改进了现有的方法。 第三,我们以大规模半监督视频对象分割为基准(又名。 密集跟踪),原创 2020-11-06 14:44:07 · 1041 阅读 · 1 评论 -
Fast Template Matching and Update for Video Object Tracking and Segmentation--论文翻译理解
Abstract在本文中,我们要解决的主要任务是多实例半监督视频对象跨帧序列的分割,其中只提供第一帧的gt信息。 基于检测的算法被广泛采用来处理这一任务,挑战在于选择匹配方法来预测结果,以及决定是否使用新预测的结果来更新目标模板。 然而,现有的方法以粗糙和僵硬的方式进行这些选择,从而影响了它们的性能。 为了克服这一局限性,我们提出了一种新的方法,利用强化学习来同时做出这两个决策。具体地,强化学习代理根据预测结果的质量学习决定是否更新目标模板。 匹配方法的选择将同时基于强化学习代理的动作历史来确定。 实验原创 2020-10-28 16:08:06 · 1348 阅读 · 0 评论 -
关于MASK RCNN
https://blog.youkuaiyun.com/myGFZ/article/details/79136610https://blog.youkuaiyun.com/WZZ18191171661/article/details/79453780原创 2020-10-26 21:37:04 · 144 阅读 · 0 评论 -
VIS--Video Instance Segmentation:MASKtrack-RCNN 论文翻译理解
大佬学习笔记1:https://blog.youkuaiyun.com/Rlin_by/article/details/104474345?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522160370104919725222439676%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fall.%2522%257D&request_id=16037010491972522243967原创 2020-10-26 21:34:49 · 2900 阅读 · 0 评论 -
Classifying, Segmenting, and Tracking Object Instances in Video with Mask Propagation
利用掩码传播对视频中的对象实例进行分类、分割和跟踪 MASK一项与 MaskTrack R-CNN[42] 类似的工作Abstrac1t我们介绍了一种同时对视频序列中的对象实例进行分类cls、分割segm和跟踪track的方法。 我们的方法,命名为MaskProp,通过添加一个掩码mask传播分支, 将每个视频帧中的帧级对象实例掩码传播到视频剪辑中的所有其他帧,从而使流行的Mask R-CNN适用于视频。!:在Mask-RCNN的基础上加一个在一段video clip中可以propagate in原创 2020-10-26 19:34:49 · 1272 阅读 · 0 评论 -
D3S A Discriminative Single Shot Segmentation Trac,tracking by segm最后的希望,不同于tracking by siamese
Abstract 摘要基于模板Z的判别跟踪器由于其鲁棒性而成为当前的主流跟踪范例,但仅限于包围盒跟踪BBOX和有限范围的变换模型,这降低了它们的定位精度。 提出了一种可区分的单镜头分割跟踪器D3S,缩小了视觉对象跟踪和视频对象分割之间的差距。 一个单阶段网络应用两个具有互补几何属性的目标模型,一个对包括非刚性变形在内的大范围变换不变,另一个假设刚性对象,以同时实现高鲁棒性和在线目标分割。 在没有按数据集微调和仅针对分段进行培训作为主要输出的情况下,D3S在VOT2016、VOT2018和GOT-10k基准原创 2020-10-19 09:23:26 · 872 阅读 · 0 评论 -
ECO,深度学习和相关滤波的结合,精读,这个发现了不太行,终止
大佬笔记:https://blog.youkuaiyun.com/qq_34919792/article/details/89893433摘要近年来,基于区分相关滤波器(DCF)的方法已大大提高了跟踪的最新水平。 然而,在追求不断提高的跟踪性能时,它们的特征速度和实时能力已逐渐消失。 此外,具有大量可训练参数的日益复杂的模型引入了严重过度拟合的风险。 在这项工作中,我们解决了计算复杂性和过拟合问题背后的关键原因,目的是同时提高速度和性能。我们重新审视DCF的核心公式,并引入:(i)一个分解卷积算子, 它大大原创 2020-10-13 18:44:00 · 1402 阅读 · 0 评论 -
Online Visual Tracking with One-Shot Context-Aware Domain Adaptation阅读翻译
Abstract在线学习策略使视觉跟踪器可以通过学习特定领域的线索来更强大地抵抗各种失真。 但是,跟踪器采用此策略无法充分利用背景区域的区分上下文。 此外,由于每个时间步长都缺乏足够的数据,因此在线学习方法还可能使跟踪器易于过度拟合背景区域。 在本文中,我们提出了一种域自适应方法来增强语义背景上下文的贡献。 领域适应方法仅由现成的深度模型来支撑。 所提出的方法的优势在于其具有判别能力,可以应对严重的咬合和背景杂乱的挑战。 我们进一步引入了一种成本敏感型损失,以减轻非语义背景对语义候选者的支配性,从而解决了原创 2020-10-04 10:30:26 · 430 阅读 · 0 评论 -
Ocean/Ocean+: 实时目标跟踪分割算法《Object-aware Anchor-free Tracking》翻译
在过去的几年中,基于anchor的Siamese算法成为了单目标跟踪的主流。但是其本身在训练时设置了较为严苛的正负样本阈值(IoU>0.6)。这种设置固有的问题是:算法在训练时无法“看见”重合度较小的anchor,如果在测试时候分类分支将这样的anchor选为目标区域,那回归网络预测结果将非常差。本次分享,我们邀请到了中科院模式识别实验室的张志鹏博士。为解决上述问题,他们在论文中提出了基于anchor-free的回归网络,和基于特征对齐的object-aware分类网络。anchor-free回归网原创 2020-09-02 15:47:49 · 8735 阅读 · 0 评论 -
基于癫痫心电图的gru建模
datasets:abstract该数据库收集自波士顿儿童医院,其中包括患有难治性癫痫发作的儿科患者的脑电图记录。停用抗癫痫药物后最多持续几天对受试者进行监测,以表征其癫痫发作并评估其对手术干预的候选资格。资料说明从22个受试者中收集了23个病例的记录(5例男性,3-22岁; 17例女性,1.5-19岁)。 (案例chb21是在案例chb01之后1.5年从同一女性受试者获得的。)文件SUBJECT-INFO包含每个受试者的性别和年龄。 (案例chb24已于2010年12月添加到此收藏中,并且当前未包原创 2020-08-27 15:02:08 · 395 阅读 · 0 评论 -
UpdateNet -- 大致理解
AbstractSiam方法通过从当前帧中提取外观模板来解决视觉跟踪问题,该模板用于在下一帧中定位目标。通常,此模板与前一帧中累积的模板线性组合,导致信息随时间呈指数衰减。 尽管这种更新方法可以改善结果,但其简单性限制了通过学习更新可能获得的潜在收益。 因此,我们建议用一种学习更新的方法来代替手工更新功能。 我们使用一个称为UpdateNet的卷积神经网络,该网络给出了初始模板,累积的模板和当前帧的模板,旨在估计下一帧的最佳模板。 UpdateNet紧凑,可以轻松集成到现有的暹罗跟踪器中。 我们通过将原创 2020-07-28 20:59:47 · 4127 阅读 · 0 评论 -
MoNet: Deep Motion Exploitation for Video Object Segmentation
摘要在本文中,我们提出了一种新颖的MoNet模型,该模型从帧表示学习和分割细化两个方面深入挖掘运动线索来提高视频对象的分割性能。 具体而言,MoNet利用计算出的运动提示(即光流)通过对齐和整合来自其邻居的表示来增强目标帧的表示。 新的表示形式为分割提供了有价值的时间上下文 ,并提高了对各种常见污染因素的鲁棒性,例如运动模糊,外观变化和视频对象变形。 此外,MoNet可以解决运动不一致的问题,并将这种运动提示转换为前景/背景,然后才能避免因混淆实例和嘈杂区域而分散注意力。 通过引入距离变换层,MoNet可原创 2020-07-10 14:51:05 · 1004 阅读 · 0 评论 -
torch cpu gpu 转换
1.CPU tensor转GPU tensor:cpu_imgs.cuda()12.GPU tensor 转CPU tensor:gpu_imgs.cpu()13.numpy转为CPU tensor:torch.from_numpy( imgs )14.CPU tensor转为numpy数据:cpu_imgs.numpy()15.note:GPU tensor不能直接转为numpy数组,必须先转到CPU tensor。6.如果tensor是标量的话,可以直接使用 item() 函数原创 2020-07-09 10:00:56 · 1962 阅读 · 0 评论 -
工作思路
在我的base code 上 ,目前有三部分想法第一部分在base、 code的trakcer之后,首先要做的是找到提取特征后 分类回归前的特征图,featmap。然后与 刚写好的Pybms做图像处理。第二部分在base、coda的trainnet部分,我们做差创建一个mask,然后在rpn提取的img上做覆盖,使得mask内部的权重加大,外部的背景弱化。第三部分如图所示,具体我们稍后再想其实概括就是将显著性监测和分割变成关注度视觉网络...原创 2020-07-08 19:18:31 · 164 阅读 · 0 评论 -
Siamese Keypoint Prediction Network for Visual Object Tracking---论文翻译
paper:http://xxx.itp.ac.cn/pdf/2006.04078v1code:https://github.com/ZekuiQin/SiamKPNAbstract视觉对象跟踪旨在根据给定的初始边界框来估计视频序列中任意目标的位置。通过利用离线特征学习,暹罗范式最近已成为高性能跟踪的领先框架。但是,当前现有的暹罗跟踪器要么严重依赖于基于锚的复杂检测网络,要么缺乏抵抗干扰者的能力。在本文中,我们提出了暹罗关键点预测网络(SiamKPN)来应对这些挑战。在使用Siamese主干进行特征嵌原创 2020-06-10 16:11:08 · 832 阅读 · 0 评论 -
个人生产力配置
I7 9700f技嘉 z390Gaming X 2925七彩虹 Rtx 2070super Vulcan X OC 火神 3785威刚游戏威龙 3200MHZ 8*2 396威刚S11 Lite 256g ssd 250海韵Croe GX650全模组 579九州风神大双塔 199先马鲁班1 189两个RBG风扇 0Total = 8323...原创 2020-06-09 15:31:25 · 235 阅读 · 1 评论 -
pip超时,更换国内原
pip源的更改:pip的默认源在国外,pip install some_packages特别慢,经常会超时,导致安装失败;pip 更换为国内的镜像一:使用方法: ①临时使用:pip install -i https://pypi.tuna.tsinghua.edu.cn/simple 库名 #清华的大学的镜像 ②永久修改: (1)linux: 修改 ~/.pip/pip.conf (没有就创建一个), 内容如下:[global]index-url = https://pypi.t原创 2020-06-05 21:00:52 · 253 阅读 · 0 评论 -
IOU,GIOU,DIOU,CIOU
IOU: https://www.jianshu.com/p/e3bf67cd4459https://blog.youkuaiyun.com/leonardohaig/article/details/103394369?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase&depth_1-utm_source=distribute.pc_relevant.none-task-bl原创 2020-06-02 15:16:55 · 1694 阅读 · 0 评论 -
anchor-based 与 anchor-free的区别
https://zhuanlan.zhihu.com/p/62372897原创 2020-06-01 19:44:56 · 1844 阅读 · 1 评论 -
pytorch网络集中权重初始化的方法
权重初始化对于训练神经网络至关重要,好的初始化权重可以有效的避免梯度消失等问题的发生。在pytorch的使用过程中有几种权重初始化的方法供大家参考。注意:第一种方法不推荐。尽量使用后两种方法。def weights_init(m): classname = m.__class__.__name__ if classname.find('Conv') != -1: m.weight.data.normal_(0.0, 0.02) elif classname.fi原创 2020-05-31 14:22:05 · 1419 阅读 · 0 评论 -
Siamese Box Adaptive Network for Visual Tracking --Siamban,CVPR2020单目标跟踪开源
论文链接 : http://xxx.itp.ac.cn/pdf/2003.06761v2.pdf开源项目:https://github.com/hqucv/siamban创新点:siamban框架改进:准确估计目标的尺度和纵横比由于RPN引入导致的参数复杂性Abstract现有的跟踪器大多依赖于多尺度搜索方案或预定义的锚来精确估计目标的尺度和纵横比(the scale and aspect ratio of a target)。不幸的是,它们通常需要无脑的启发式配置。为了解决这个问题,我们提出了原创 2020-05-31 14:14:04 · 4850 阅读 · 5 评论 -
解决arxiv论文下载速度慢的问题,秒下
重点:解决arxiv下载速度慢的方法arxiv属于国外网站,中国下载网速较慢,推荐使用中科院arxiv的镜像地址:http://xxx.itp.ac.cn具体使用方法:把要访问 arxiv 链接中前面的域名从 https://arxiv.org 换成 http://xxx.itp.ac.cn如:CycleGAN论文下载地址 https://arxiv.org/pdf/1703.10593.pdf 换成:http://xxx.itp.ac.cn/pdf/1703.10593.转载 2020-05-31 10:13:58 · 1227 阅读 · 0 评论 -
MAML-Tracker --CVPR2020,目标跟踪方向论文翻译
论文地址:https://arxiv.org/pdf/2004.00830.pdf基于实例检测的跟踪:元学习方法Abstract我们认为跟踪问题是一种特殊类型的对象检测问题,我们称之为实例检测。有了适当的初始化,检测器就可以通过从单个图像学习新实例而快速转换为跟踪器。我们发现(model-agnostic )模型无关元学习(MAML)提供了一种初始化检测器以满足我们需求的策略。我们提出了一个有原则的三步方法来构建一个高性能的跟踪器。首先,选择任何受过梯度下降训练的现代物体探测器。第二,使用MAML进原创 2020-05-30 16:13:28 · 610 阅读 · 0 评论 -
CVPR2020开源文章--跟踪部分
https://arxiv.org/abs/2004.00830https://arxiv.org/pdf/2004.01888原创 2020-05-29 12:49:21 · 261 阅读 · 0 评论 -
论文翻译--Deep Feature Flow for Video Recognition (继续更新中)
Abstract深度卷积神经网络在图像识别方面取得了很大的成功。然而,将最先进的图像识别网络转换成视频并非易事,因为每帧的评估速度太慢,而且负担不起。提出了一种基于深度特征流的快速、准确的视频识别框架。它只在稀疏关键帧上运行繁琐的卷积子网络,并通过流场将它们的深度特征映射传播到其他帧。由于流计算速度相对较快,因此实现了显著的加速。整个体系结构的端到端训练显著提高了识别精度。深度特征流具有灵活性和...原创 2020-03-10 11:10:03 · 800 阅读 · 0 评论 -
Learning Discriminative Model Prediction for Tracking --- 论文翻译
这是CVPR2019上一篇单目标跟踪的文章,效果特别好.虽然现在研究的是siam系列,但是翻译一下,以后学习用得到Abstract目前,端到端可训练计算机视觉系统的发展给视觉跟踪带来了巨大的挑战。与大多数其他视觉问题相比,跟踪需要在推理阶段在线学习一个robust的目标特定的外观模型。为了实现端到端可训练,目标模型的在线学习需要嵌入到跟踪体系结构中。由于这些困难,流行的Siamese只是简单...原创 2020-01-08 21:57:55 · 1526 阅读 · 1 评论 -
ubuntu1804锁定笔记本自带键盘和解锁功能terminal
xinput list找到AT Translated Set 2 keyboard,记住后面的ID,如我的ID为15。xinput set-prop 21 “Device Enabled” 0xinput set-prop 21 “Device Enabled” 1原创 2020-01-08 15:28:23 · 717 阅读 · 0 评论 -
wget用法--断点续传
第一次 wget http://…如果遇到网络中断的情况大发生第二次 wget -c http://…会衔接上第一次的继续执行.第一次可以直接wget下载,然后之后想接着下载就wget -c就好啦。换言之,首次-c不-c无所谓哒...原创 2020-01-07 19:44:12 · 798 阅读 · 0 评论 -
关于数据扩充的仿射变换问题
https://blog.youkuaiyun.com/qq_30815237/article/details/96571447https://blog.youkuaiyun.com/JRRRJ/article/details/81092805原创 2020-01-05 15:36:44 · 313 阅读 · 0 评论 -
CenterNet: Keypoint Triplets for Object Detection ----- 论文翻译理解
Abstract在对象检测中,基于关键点的方法经常遇到大量不正确的对象边界框,这可能是由于缺少对裁剪区域的额外检查。本文提出了一种有效的解决方案,以最小的代价探索每个裁剪区域内的视觉模式。在一个具有代表性的单阶段基于关键点的探测器(称为街角网)上构建我们的框架。我们的方法名为CenterNet,它将每个对象作为关键字的三联体(而不是一对)来检测,从而提高了精确度和召回率。为此,我们设计了 cas...原创 2019-12-30 17:01:47 · 572 阅读 · 0 评论