- 博客(18)
- 收藏
- 关注
原创 IouNet印象
博客IOU和分类得分之间没有明显的正相关,但是IOU和回归得分之间有明显的正相关。用分类的得分作为依据判断一个预测框是否准确预测对groundtruth来说是不合理的。
2021-10-20 19:42:10
111
原创 xml (pascal voc)格式转 otb格式
import sysimport osimport jsonimport globimport numpy as npimport xml.etree.ElementTree as ETdef get(root,name): return root.findall(name)def get_and_check(root,name,length): vars = root.findall(name) # print(vars) # print(len(vars
2021-08-12 16:07:08
188
1
原创 FCOS阅读
Dense在图像金字塔上执行跟踪,违背了FCNs一次完成所有卷积运算的本性。边界框高度重叠的地方有一个很强的歧义性,就是说,对于重叠区域的像素来说,你不确定回归哪个边界框。而FPN消除这种歧义性。FCOS can be used as a RegionProposal Networks (RPNs) in two-stage detectors,RPN是?yolov1召回率低,因为只用center周围的点预测。CornerNet是近期提出的one-stage系探测器,无anchor,需要一个复杂的
2021-01-02 20:05:24
103
原创 2020-11-15
model 代码class ResNet(nn.Module):def __init__(self, num_classes, block, layers): self.inplanes = 64 super(ResNet, self).__init__() self.conv1 = nn.Conv2d(3, 64, kernel_size=7, stride=2, padding=3, bias=False) self.bn1 = nn.BatchNorm2d(64)
2020-11-15 22:04:17
256
转载 2020-11-15
basicblock结构包含一个残差支路和short-cut支路,比传统的卷积结构多了一个short-cut支路,用于传递低层的信息使得网络能够训练很深。bottleneck先通过一个1x1的卷积减少通道数,使得中间卷积的通道数减少为1/4;中间的普通卷积做完卷积后输出通道数等于输入通道数;第三个卷积用于增加(恢复)通道数,使得bottleneck的输出通道数等于bottleneck的输入通道数。这两个1x1卷积有效地较少了卷积的参数个数和计算量。在较深的网络中BottleNeck会在参数上更加节约,然后
2020-11-15 16:22:02
163
原创 Retina 代码调试过程
各位有个准备,这应该是个很长很心累的故事,because i am a han han。首先下载好pycharm 社区版。在这里https://github.com/yhenon/pytorch-retinanet 下载代码,再用pycharm打开。首先找服务器配环境。目标是 实现“windows下配置retina”。或“在服务器上配置python环境"...
2020-10-30 21:18:51
212
原创 Focal loss论文翻译
用于深度目标检测的focal loss0 .摘要目前最受欢迎的目标探测器是基于RNN推广的two-stage方法,其中候选对象位置的稀疏集使用分类器。相反,对可能的目标位置进行有规律、密集采样的one-stage探测器有可能更快更简单,但准确率远远落后于two-stage探测器。我们调查此原因,发现深度探测器训练时发生的前背景分类的极度不平衡是主要原因。我们通过重塑标准交叉熵损失来解决,这样它就能降低分配给易分类样本的损失。我们的Focal Loss专注于在一组稀疏的困难样本上训练,并组织大量的易负样本
2020-10-26 20:29:42
692
1
原创 FCOS: Fully Convolutional One-Stage Object Detection
FCOS:全卷积单目标检测算法0 摘要我们提出了一种全卷积的单目标检测算法(FCOS)以per-pixel prediction的方式来解决目标探测问题,模拟语义分割。目前水平最先进的目标探测器
2020-10-18 21:20:53
355
原创 20_10_16学习日记
SenseTime(商汤科技)实现的软件系统,实现单一对象跟踪算法,包括SiamRPN和SiamMask,python编写使用pytorch框架,目标是为视觉跟踪提供高质量、高性能的代码库。pysot包括以下的视觉跟踪算法SiamMask(CVPR 2019)SiamRNN++(CVPR 2019 oral)DaSimRPN(ECCV 2018)SiamRPN(CVPR 2018)SiamFC(ECCV 2016)Pysot使用以下的网络架构ResNet{18, 34, 50}Mobile
2020-10-16 10:30:26
209
原创 Real-Time MDNet
本文为对Real-Time MDNet的大致翻译。1 介绍从特征图执行RoIPooling,由于特征图的粗量化,简单的实施会导致较差的定位。提出双线性插值实现RoI对齐。CNNs不善于区分在低等或中级对象表示形式的对象实例之间的差异。两个问题:1.精度下降 2.无法有效区分一个类别中的两个对象。改进:1.RoIAlign层从前面的全卷积特征图提取目标表示、构建高分辨率的特征图,扩大接受域(学习丰富的语义信息)。2.预训练阶段引入实例嵌入损失,观测到的目标实例彼此分开嵌入到一个隐藏空间。贡献:1.改进
2020-10-14 22:29:18
446
1
原创 High-Speed tracking with kernelized correlation filters
核化相关滤波器的高速追踪0 摘要追踪器的核心部件是分类器,以翻译和缩放后的样本块进行训练。使用傅里叶变换对其进行对角化。提出了KCF和CDF。关键词:目标追踪、循环矩阵、离散傅里叶变换、岭回归、相关性过滤器riddled with redundancies 充斥着冗余pixels:像素 circulant 循环行列式 Discrete Fourier Transform 离散傅里叶变换 diagonalize 使…对角化orders of magnitude 数量级 correlation
2020-10-14 21:57:52
292
转载 滑动窗口
什么是滑动窗口?其实就是一个队列,比如例题中的 abcabcbb,进入这个队列(窗口)为 abc 满足题目要求,当再进入 a,队列变成了 abca,这时候不满足要求。所以,我们要移动这个队列!如何移动?我们只要把队列的左边的元素移出就行了,直到满足题目要求!一直维持这样的队列,找出队列出现最长的长度时候,求出解!时间复杂度:O(n)O(n)class Solution {public...
2020-10-07 21:23:13
81
转载 判断回文字符串
动态规划法为了改进暴力法,我们首先观察如何避免在验证回文时进行不必要的重复计算。考虑 \textrm{“ababa”}“ababa” 这个示例。如果我们已经知道 \textrm{“bab”}“bab” 是回文,那么很明显,\textrm{“ababa”}“ababa” 一定是回文,因为它的左首字母和右尾字母是相同的。我们给出 P(i,j)P(i,j) 的定义如下:这产生了一个直观的动态规划...
2020-01-18 15:22:21
267
原创 letcode 题解
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Ma...
2020-01-10 16:23:44
476
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人