SiamFC复现结果

原创

已于 2022-05-24 14:28:23 修改 · 922 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#目标跟踪 #深度学习 #计算机视觉

于 2022-05-23 16:04:30 首次发布

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

文章目录

前言
一、原论文结果
- The OTB-13 benchmark
- The VOT benchmarks
二、Performance
- OTB2015

前言

论文：Fully-Convolutional Siamese Networks for Object Tracking
代码：基于pytorch框架的
https://github.com/huanglianghua/siamfc-pytorch

提示：以下是本篇文章正文内容，下面案例可供参考

一、原论文结果

The OTB-13 benchmark

OTB-13 benchmark的OPE(一次评价)、TRE(时间稳健性评价)和SRE(空间稳健性评价)的成功曲线图

The VOT benchmarks

VOT-14 results
VOT-15 results

二、Performance

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

tsmsiwei

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

SiamFC代码配置复现

ZZXin_的博客

04-29

8761

写在前面最近在研究SiamRPN，究其根本，CNN依托于AlexNet骨架，所以花些功夫研究以下SiamFC代码，将其阶段性复现。 [ Tracking only ] 关于GPU显卡配置、cudn和cudnn安装可以参考Ubuntu16.0下安装显卡驱动、 cuda10.0 、cudnn的活生生案例 1.Ubuntu16.04配置Matconvnet 可参考官方教程 %% 编译安装MatCon...

单目标跟踪算法及其复现过程---SiamFC（一）

weixin_58244117的博客

04-05

4545

在test.py文件中，就是利用训练出来的模型进行测试，需要更改预训练模型的路径，测试集的路径，以OTB100为例，最后输出的是对每一帧目标位置的坐标点。代码如下：首先需要下载got10k官方库，只需要在终端输入(注意:在终端安装各种库的时候不能使用网络代理)，在环境已经配置到的情况下，只需要该其中的路径和就可以运行。这个系列博客仅为了记录各目标跟踪算法的复现（大多为跑通大佬们实现的代码），包括其中出现的很多问题和错误，学到的新知识等等。解决，而且只使用在线的方法，限制了他们可以学习的模型的丰富性。

参与评论您还未登录，请先登录后发表或查看评论

【目标跟踪 SOT】SiamFC -用于对象跟踪的全卷积孪生网络

davidyang_980的博客

12-14

4061

SiamFC - 全卷积孪生网络摘要任意目标追踪问题的传统方法一般是基于在线学习的方法，只使用训练视频本身的数据，但这种方法限制了可以学习的模型的深度。虽然已经在深度神经网络上有了常识，但是当无法提前知道需要追踪那个目标时，就需要Stochastic Gradient Descent 来改善网络的权重，极大的影响了整个系统的速度。在本文中提出了一个新的端到端全卷积孪生网络(Fully- Convolutional Siamese Network)，使用ILSVRC15数据集进行训练及网络评估。我们的网络

单目标跟踪 siamFC++ (siamfcpp) 的 c++ 复现

m0_56929595的博客

08-25

1709

## 已开源

SiamFC代码配置复现 matlab版本

weixin_44287997的博客

10-06

3755

原创 SiamFC代码配置复现 ...

siamFC算法复现及使用自己的数据集进行测试

m0_62404686的博客

11-23

1055

使用自制的数据集进行siamFC测试

【计算机视觉】siamfc论文复现实现目标追踪

m0_64280569的博客

07-20

2408

记录学习中的相关笔记及参考的一些优秀博主的博文。

[论文复现] Fully-Convolutional Siamese Networks for Object Tracking

sannianyihoushuma的博客

01-13

364

https://www.codetd.com/article/2983959

SiameseFC-TensorFlow 代码详细注解（一）：预训练模型下载转换测试以及结果可视化

StayHappy_Fan的博客

05-27

1万+

说明：该系列博客源码链接为：https://github.com/bilylee/SiamFC-TensorFlow，是实验室同小组的师兄用TensorFlow实现SiameseFC算法的最终公开版本，经过了长时间的打磨，各个模块功能明确，整体可读性和可移植性极好，我相信这对做Tracking的小伙伴来说，是个入门SiameseFC Tracker的特别好的选择。哈哈，觉得代码很棒的小伙伴们可以点...

SiamFC代码分析(architecture、training、test)

热门推荐

qq_41831753的博客

02-14

1万+

文章目录1、architecture 2、training 3、test 本文对SiamFC代码进行详细分析，并从代码角度阐述理论。

SiamFC文档

08-20

SiamFC无水印PDF和Word翻译，参考https://blog.youkuaiyun.com/qq_36449741/article/details/99696195

SiamFC++.pptx

04-05

这是2020年旷视发表在AAAI上的论文，代码已经公布，此ppt是我组会汇报所做，思路清晰，语言简洁

siamfc++源码阅读笔记.pdf

07-31

这是在看siamfc++源码：https://github.com/MegviiDetection/video_analyst的阅读笔记，会根据一些重要的方面记一点笔记，希望大家下载后能结合博客看，谢谢

目标追踪算法siamFC

06-19

论文Fully-Convolutional Siamese nets for object tracking的tensorflow代码

SiamFCdemo运行所需stats.mat文件

03-02

此文件为SiamFC的tracking only中的demo（vot15_bag）正常运行所需的stats.mat文件

SiamFC——pytorch代码分析

Williamcsj的博客

03-15

479

SiamFC代码分析(architecture、training、test) siamfc-pytorch代码讲解（二）：train&siamfc

SiamFC论文理解及代码理解

wangxw0611的博客

03-07

4014

文章目录前言一、论文翻译二、论文代码1.backbone网络前言记录自己阅读复现SiamFC的全过程，包括论文翻译，代码理解等一、论文翻译论文原文：链接：https://pan.baidu.com/s/1wvXra0Ji6L9IMVZikaUs9Q 提取码：s7t3 本文是Siam系列跟踪论文的开篇之作，兼容了速度与精度，引起跟踪社区极大的关注。论文中对一些细节描述分非常充分，适合精读本文。二、论文代码代码参考; https://github.com/HonglinChu/SiamTra.

SiamFC论文解读及代码实现

weixin_43913124的博客

03-10

7705

SiamFC论文解读及代码实现摘要：传统上，任意目标跟踪的问题是通过专门在线学习目标外观的模型来解决的，使用视频本身作为唯一的训练数据。尽管这些方法取得了成功，但他们的纯在线方法固有地限制了他们可以学习的模型的丰富性。最近，有人试图利用深层卷积网络的表达能力。然而，当要跟踪的目标事先未知时，需要在线执行随机梯度下降以适应网络的权重，这严重影响了系统的速度。在本文中，我们在ILSVRC15数据集上为视频中的目标检测配备了一个基本的跟踪算法和一个新的端到端训练的孪生神经网络。我们的跟踪器以超过实时的帧速率运

【论文学习】《Fully-Convolutional Siamese Networks for Object Tracking》2016年SiamFC 全卷积孪生网络用于目标跟踪

SkyLeopard的博客

07-31

2122

在这项工作中，我们脱离了跟踪中采用的传统在线学习方法，并展示了一种专注于在离线阶段学习强嵌入的替代方法。与在分类设置中的使用不同，我们证明，对于跟踪应用，孪生全卷积深度网络能够更有效地使用可用数据。这不仅反映在测试时，通过执行有效的空间搜索，也反映在训练时，其中每个子窗口都有效地代表一个有用的样本，而几乎没有额外的成本。实验表明，深度嵌入为在线跟踪器提供了自然丰富的特征来源，并使简单的测试时策略表现良好。我们相信这种方法是对更复杂的在线跟踪方法的补充，并期望未来的工作能够更彻底地探索这种关系。

全卷积孪生网络（SiamFC）的复现步骤，要求步骤详细，解释明确，步骤之间没有跳跃。注意：本复现是针对没有模型复现经验而能够看懂基本的输入输出代码的人。

最新发布

04-28

### 全卷积孪生网络（SiamFC）详细复现教程 #### 1. ### 准备环境要复现 SiamFC，首先需要安装必要的 Python 库。推荐使用 Anaconda 或 Miniconda 来管理虚拟环境和依赖项。以下是所需的主要库及其用途： - `torch` 和 `torchvision`: 提供深度学习框架支持。 - `numpy`: 处理数组运算。 - `opencv-python`: 加载和处理图像数据。创建一个新的 Conda 虚拟环境并安装所需的包： ```bash conda create -n siamfc python=3.9 conda activate siamfc pip install torch torchvision numpy opencv-python matplotlib ``` --- #### 2. ### 数据准备 SiamFC 需要两部分数据：模板帧（template frame）和搜索区域（search region）。通常，这些数据来自目标跟踪的标准数据集，例如 OTB[^3]、VOT[^4] 或 GOT-10k[^5]。下载其中一个数据集，并将其解压到指定目录下。假设路径为 `/path/to/dataset/`。 --- #### 3. ### 构建模型根据 SiamFC 的论文[^2]，构建一个全卷积孪生网络。以下是一个简化版的 PyTorch 实现： ```python import torch import torch.nn as nn import torch.nn.functional as F class SiamFC(nn.Module): def __init__(self): super(SiamFC, self).__init__() # 定义特征提取模块 self.feature_extractor = nn.Sequential( nn.Conv2d(3, 96, kernel_size=11, stride=2), nn.BatchNorm2d(96), nn.ReLU(inplace=True), nn.MaxPool2d(kernel_size=3, stride=2), nn.Conv2d(96, 256, kernel_size=5, stride=1), nn.BatchNorm2d(256), nn.ReLU(inplace=True), nn.MaxPool2d(kernel_size=3, stride=2), nn.Conv2d(256, 384, kernel_size=3, stride=1), nn.BatchNorm2d(384), nn.ReLU(inplace=True), nn.Conv2d(384, 384, kernel_size=3, stride=1), nn.BatchNorm2d(384), nn.ReLU(inplace=True), nn.Conv2d(384, 256, kernel_size=3, stride=1), nn.BatchNorm2d(256) ) def forward(self, z, x): """ 前向传播过程 :param z: 模板帧 (Batch Size, Channels, Height, Width)，形状通常是 (N, 3, 127, 127) :param x: 搜索区域 (Batch Size, Channels, Height, Width)，形状通常是 (N, 3, 255, 255) :return: score_map (Batch Size, 1, H_out, W_out) """ z_feat = self.feature_extractor(z) # 提取模板帧特征 x_feat = self.feature_extractor(x) # 提取搜索区域特征 # 计算互相关响应图 batch_size = x_feat.shape[0] depth = z_feat.shape[1] height_x, width_x = x_feat.shape[-2:] height_z, width_z = z_feat.shape[-2:] x_corr = [] for i in range(batch_size): xi = x_feat[i].view(depth, height_x * width_x) # 展平空间维度 zi = z_feat[i].view(depth, height_z * width_z).permute(1, 0) # 转置展平后的模板特征 response = F.linear(xi.t(), zi.t()) # 线性层实现互相关操作 x_corr.append(response.view(height_x, width_x)) corr_tensor = torch.stack([F.relu(corr) for corr in x_corr], dim=0) # 合并批次结果 return corr_tensor.unsqueeze(1) # 返回形状为 (N, 1, H_out, W_out) 的得分图 ``` --- #### 4. ### 数据加载与预处理编写自定义的数据加载器以读取模板帧和搜索区域。这里提供一个简单的示例： ```python import cv2 import numpy as np def preprocess_image(image_path, size=(127, 127)): """加载并缩放图像""" img = cv2.imread(image_path) img_resized = cv2.resize(img, size[::-1]) # OpenCV 使用 (H, W) 形状 img_normalized = img_resized.astype(np.float32) / 255. img_transposed = np.transpose(img_normalized, (2, 0, 1)) # 将通道移到第一个维度 return torch.tensor(img_transposed).unsqueeze(0) # 添加批量维度 # 示例调用 z_path = "/path/to/template_frame.jpg" x_path = "/path/to/search_region.jpg" z = preprocess_image(z_path, size=(127, 127)) x = preprocess_image(x_path, size=(255, 255)) ``` --- #### 5. ### 推理流程初始化模型并对输入进行推理： ```python model = SiamFC() model.eval() # 设置为评估模式 with torch.no_grad(): output = model(z, x) print("Score Map Shape:", output.shape) # 输出形状应为 (1, 1, 17, 17) ``` --- #### 6. ### 结果可视化绘制得分图以观察预测结果： ```python import matplotlib.pyplot as plt score_map = output.squeeze().cpu().numpy() plt.imshow(score_map, cmap='hot', interpolation='nearest') plt.colorbar() plt.title('Correlation Score Map') plt.show() ``` 最高分的位置对应于目标在搜索区域中的位置。 --- #### 7. ### 微调与优化如果需要进一步提升性能，可以通过微调预训练权重来改进模型。可以从 ImageNet 上下载 AlexNet 的预训练权重[^4] 并迁移到 SiamFC 中。 --- #### 总结上述步骤涵盖了从零开始搭建 SiamFC 所需的核心组件。尽管这是一个简化的版本，但它足以帮助理解 SiamFC 的工作机制。 ---