
论文学习
文章平均质量分 61
奋斗的ran雪
主要记录编程过程中的各种问题
展开
-
解决wps中的一些格式问题
1,安装mathtype后,wps不能复制粘贴了找到开发者工具里面的加载项,取消勾选,确定之后可以看到mathtype不再出现在菜单栏里,复制粘贴可以使用,并且可以照样使用mathtype,只是从外部唤起。2,解决论文左右排版高度不一致的问题,找到插入,分页,连续分节符,就可以解决了3,两排之后出现排版乱的情况从左上角文件中找到选项,然后再格式标记里取消所有勾选,就能够看到文章里面的分页分节符,删掉就可以了...原创 2022-03-31 14:59:50 · 2599 阅读 · 0 评论 -
ENet:一种用于实时语义分割的深层神经网络结构
摘要:实时执行像素语义分割的能力在移动应用程序中至关重要。最近针对这一任务的深层神经网络的缺点是需要大量的浮点运算,并且运行时间长,这阻碍了其可用性。在本文中,我们提出了一种新的深度神经网络体系结构ENet(高效神经网络),专门为需要低延迟操作的任务创建。ENet的速度高达18CamVid,Cityscaoes和SUN数据集上对其进行了测试,并报告了与现有最先进方法的比较,以及网络精度和处理时间之间的权衡。我们减少了嵌入式系统上拟议体系结构的性能度量,并提出了可能的软件改进建议,是ENet更快。介绍原创 2021-11-09 10:20:36 · 3772 阅读 · 0 评论 -
siamGAT跟踪过程理解
在阅读到3.3. The Tracking Phase时,作者提到跟踪的目的是预测当前帧中目标的边界框。对于位置(i,j),建议的框架可以产生6D向量Tij=(cls,cen,l,t,r,b),其中cls表示分类的前景分数,cen表示中心度socre,l+r和t+b表示当前帧中目标的预测宽度和高度。在跟踪过程中,边界框的大小和纵横比在连续帧中通常会发生较小的变化。为了使用这种时空一致性监督预测,我们采用了[3]中介绍的尺度变化惩罚pij对分类分数cls进行重新排序,它允许更新的6D向量P Tij=(clsi原创 2021-10-19 15:10:11 · 1511 阅读 · 0 评论 -
基于分类和回归子网的包围盒预测(siamGAT和siamCAR的头部)
siamGAT和siamCAR都使用相同的预测模块,具体参考siamCAR论文原文:https://arxiv.org/abs/1911.072413.2. Bounding Box Prediction with Classificationand Regression Subnetwork在代码中实现为 def forward(self, pred, target, weight=None): pred_left = pred[:, 0] ..原创 2021-10-14 11:41:19 · 950 阅读 · 0 评论 -
深度学习之迁移学习介绍与使用
迁移学习概述在深度学习领域,通过预训练模型作为检查点开始训练生成神经网络模型实现对新任务的支持,这种方法通常被称为迁移学习,它的好处是不用再重头开始设计与训练一个全新的网络,而是基于已经训练好的网络模型,在其基础上进行参数与知识迁移,只需要很少量的计算资源开销与训练时间就可以实现对新任务的支持。要理解迁移学习的整个过程就是要搞清楚下面三件事:迁移学习迁移什么 迁移学习是怎么迁移的 迁移学习什么时候使用迁移什么在预训练模型中存在各种特征数据与权重信息、有些是与分类识别的对象本身关联比转载 2021-10-11 11:15:03 · 1648 阅读 · 0 评论 -
10/8周报 学习siamgat中testTracker测试过程代码模块
理解的是作者的源码,地址GitHub - ohhhyeahhh/SiamGAT: Code for the paper "Graph Attention Tracking". (CVPR2021)project部分结构一、从testTracker中的main()函数进入def main(): # load config cfg.merge_from_file(args.config) # Test dataset dataset_root='/19...原创 2021-10-10 14:58:24 · 925 阅读 · 3 评论 -
SiamGATTracker()学习
tracker()函数的作用就是传入video sequence和first frame中的ground truth bbox,然后通过模型,得到后续帧的目标位置,主要通过两个函数实现:init和trackeriniti:当idx == 0,即传入第一帧图片时,初始化参数,计算一些之后搜索区域的中心等 tracker:idx不等于0,传入后续的帧,根据网络返回目标的box坐标。 class SiamGATTracker(SiameseTracker): def __init__(self,原创 2021-10-10 14:52:04 · 447 阅读 · 2 评论 -
ModelBuider()
def __init__(self): super(ModelBuilder, self).__init__() # build backbone self.backbone = get_backbone(cfg.BACKBONE.TYPE, **cfg.BACKBONE.KWARGS) # build car head self.car_h...原创 2021-10-10 11:35:49 · 305 阅读 · 1 评论 -
如何获得裁剪区域
get_subwindow() def get_subwindow(self, im, pos, model_sz, original_sz, avg_chans): if isinstance(pos, float): pos = [pos, pos] sz = original_sz im_sz = im.shape c = (original_sz + 1) / 2 cont原创 2021-10-10 10:49:52 · 477 阅读 · 1 评论 -
解决qt.qpa.xcb: could not connect to display问题
以服务器作为远程解释器,本地pycharm或vscode调试时出现如下错误:qt.qpa.xcb: could not connect to displayqt.qpa.plugin: Could not load the Qt platform plugin "xcb" in "/home/xx/anaconda3/lib/python3.8/site-packages/cv2/qt/plugins" even though it was found.This application faile转载 2021-10-07 19:59:26 · 63294 阅读 · 27 评论 -
KCF论文学习
通常我们所说的目标跟踪任务指的是单目标跟踪任务,即给定一个图像序列,在第一帧中给出一个矩形框,然后跟踪算法需要在后续帧中跟踪这个框的内容。视觉中的目标跟踪方法一般被分成两个大类:生成类和判别类模型方法;生成类的方法:在当前帧中对目标区域建模,在下一帧中寻找与模型最为相似的区域认为是预测的目标位置,典型的有卡尔曼滤波器,Mean-shift算法等。判别类方法:当前帧以目标区域为正样本,背景为负样本,极其学习方法训练分类器,然后在下一帧中用训练好的分类器去寻找最优的区域。大部分的视觉跟踪方法都属于这一类原创 2021-04-17 09:16:51 · 645 阅读 · 0 评论 -
High-Speed Tracking with Kernelized Correlation Filters翻译
摘要大多数当代的跟踪器的核心组件是判别性分类器,其任务是区分目标和周围环境。 为了应对自然的图像变化,通常使用translated and scaled的样本块来训练该分类器。 这样的样本集充满了冗余-任何重叠的像素都被认为是相同的类。 基于这个简单的观察,我们为成千上万个translate patches的数据集提出了一个分析模型。 通过结果显示数据矩阵是循环的,我们可以使用离散傅立叶变换对角化它,将存储和计算量减少几个数量级。 有趣的是,对于线性回归,我们的公式等效于一些最快的竞争跟踪器使用的相关滤转载 2021-04-06 22:20:11 · 767 阅读 · 0 评论 -
HOG特征
hog特征:方向梯度直方图特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述。他通过计算和统计图像局部区域的梯度方向直方图来构成特征。Hog特征结合SVM分类器已经被广泛应用于图像识别中。主要思想:在一幅图像中,局部目标的表象和形状能够被梯度或边缘的方向密度分布很好的描述。(本质在于梯度的统计信息,而梯度主要存在于边缘的地方)具体实现的方法是:首先将图像分成小的连通区域,我们把它叫细胞单元。然后采集细胞单元中个像素点的梯度或边缘方向的直方图,最后把这些直方图组合起来就可以构成特征描述器。转载 2021-04-06 21:42:13 · 196 阅读 · 0 评论 -
如何画出高斯滤波器函数得到的高斯分布
import numpy as npimport matplotlib.pyplot as pltfrom mpl_toolkits.mplot3d import Axes3D def _get_gauss_response(self, img, gt): # get the shape of the image.. height, width = img.shape#取图片的长宽 # 获取网格... xx, yy = np...原创 2021-03-18 17:53:18 · 279 阅读 · 0 评论 -
有关傅里叶变换知识
傅里叶变换是一种函数在空间域和频率域的变化,从空间域到频率域的变换时傅里叶变换,而从频率域到空间域的变换是傅里叶的反变化。频域:是指在对函数或信号进行分析时,分析其和频率有关 部分,而不是和时间有关部分,和时域一词相对。时域:是描述数学函数或物理信号对时间的关系。例如一个信号的时域波形可以表达信号随着时间的变化。若考虑离散时间,时域中的函数或信号,在各个离散时间点的数值均为已知。若考虑连续时间,则函数或信号在任意时间的数值均为已知。在研究时域的信号时,常会用示波器讲信号转换为其时域的波形。两者之转载 2021-03-16 13:29:39 · 9875 阅读 · 0 评论 -
窗函数
什么是窗函数? - linmue-谭祥军的文章 - 知乎 https://zhuanlan.zhihu.com/p/24318554本文首发于公众号《模态空间》。似乎每次做FFT都需要加窗函数,很少有不加窗函数的时候。那为什么要加窗函数,加窗有什么好处,又有什么坏处呢,凭什么目的来加函数呢?本文主要内容包括:1. 为什么要加窗函数;2. 窗函数的定义;3. 窗函数的时频域特征;4. 加窗函数的原则;5. 模态测试所用窗函数;6. 窗函数带来的影响。1. 为什么.转载 2021-03-15 15:43:20 · 9826 阅读 · 1 评论 -
DSST附件
鲁棒性:在异常和危险情况下系统生存的能力。比如说,计算机软件在输入错误、磁盘故障、网络过载或有意攻击情况下,能否不死机,不崩溃,就是该软件的鲁棒性。所谓鲁棒性,也是指控制系统在一定的参数摄动下,维持其他某些性能的特征。根据对性能的不同定义,可分为稳定鲁棒性和性能鲁棒性。以闭环系统的鲁棒性作为目标射击得到的稳定控制器称为鲁棒控制器。OTB数据集:在视觉跟踪诸多论文中,OTB100常被用于计算benchmark。该数据集是指官网中的98个视频,共计100个测试场景。值得注意的时,这些视频均被拆解为单帧图片存原创 2021-03-11 16:04:54 · 153 阅读 · 0 评论 -
Discriminative Scale Space T racking翻译
英文全称:尺度估计滤波器算法见附件摘要 目标尺度的精确估计是视觉目标跟踪中一个具有挑战性的研究问题。大多数最先进的方法使用详尽的尺度搜索来估计目标的大小。穷尽性搜索策略在计算上是最昂贵的,并且在遇到大规模变化时困难重重。本文研究了基于检测跟踪框架下的精确和鲁棒尺度估计问题。我们提出了一种新的尺度自适应跟踪方法,通过学习独立的判别相关滤波器进行平移和尺度估计。利用在一组不同尺度上采样的目标外观,在线学习显式尺度滤波器。与标准方法相反,我们的方法直接学习由目标尺度的变化引起的外观变化。...原创 2021-03-11 16:04:09 · 654 阅读 · 0 评论 -
fhog
第一次看见fhog在研究复现KCF代码时传统hog特征提取hog特征(梯度统计直方图)--------1,对原图进行灰度化(hog统计的是梯度信息,色彩几乎没有贡献)。2再进行gamma压缩和归一化(减轻光照影响).3,统计每个cell里的梯度(包括大小和方向,大小用来加权方向)统计直方图。4,再把几个cell合并成一个block,作为这个block的hog特征。5,对这个特征进行归一化处理,可以进一步减轻光照影响。第四步中,合成block的时候有两种方式,overlap和non-overlop原创 2021-03-09 11:08:42 · 849 阅读 · 0 评论 -
5KCF 基于核化相关滤波器的高速跟踪论文笔记
摘要现代跟踪器的核心组件:判别分类器 其任务是区分目标和目标周围的环境。为了应对自然图像的变化,通常使用经过平移和缩放的样本patch进行训练。-------》这样的样本充满冗余,任何重叠的像素都被视为相同。------》因此本文提出了数千个平移patch的数据集分析模型。结果现实数据是循环的,我们能够使用离散傅里叶变换对数据矩阵进行对角化,从而将存储和计算开销减少几个数量级。对于线性回归-------我们的公式相当于一个相关滤波器对于核回归--------我们推导了一个新的核化相关滤波器.原创 2021-03-08 21:36:28 · 413 阅读 · 0 评论