GOT-10k

GOT-10k是一个包含10000多条视频的大规模高多样性物体跟踪基准,涵盖563个目标类别和87种运动模式。该基准用于统一深度跟踪器平台,提供通用数据和评估标准。它引入了一种无偏的one-shot原则进行评估,并设计了紧凑的测试子集。实验比较了多种基线模型在不同挑战下的性能,如遮挡、尺度变化和快速运动等。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

GOT-10k: A Large High-Diversity Benchmark for Generic Object Tracking in the Wild

INTRODUCTION

GOT-10k包含了超过10000条视频,人工标注边界框超过150万个。分为563个目标类别,87种运动模式。

Purpose:

⋅\cdot provide a unified platform for deep trackers;

⋅\cdot make tracking data and evaluation metrics more general.

1546167697316

Contribution:

Dataset. GOT-10k包含了超过10000条视频,人工标注边界框超过150万个。分为563个目标类别,87种运动模式。目标均为真实世界中的运动物体。

Benchmark. 在GOT-10k上测试了多个现今算法并评估了他们的表现。讨论了现有工作的限制以及未来工作的可能方向。

Evaluation Protocol. 引入了one-shot principle以达到对deep trackers的无偏差评估;进行了一系列实验来选择紧凑而具有高度代表性的测试子集,从而实现高效评估。

Dataset construction

1546243223681

Collection of videos:

使用了WordNet作为骨干来筛选目标和运动类别。

每个视频包含两个标签:object和motion。四个名词作为initial pool: animal, person, artifact, natural object and part。motion class延伸为locomotion, action and sport。生成出来的字典先淘汰掉不常见的/静态的/重复的词组,然后根据Youtube搜索数量进行排序,选择rank高的标签。

Annotation of trajectories:

⋅\cdot 按照目标检测的标准来设计标定框,即标定框为正矩形;

⋅\cdot 提供可见比率的注释,
可见比率是指目标可见部分的百分比,分为0,15%,30%,45%,60%,75%,90%,100%七种情况。

1546243012647

Dataset splitting:

数据集分为训练,验证,测试三个子集。

训练集和测试集之间需要有明确的隔离以验证模型的泛化能力:

​ ——one-shot principle,训练集和测试集不重叠;

设计紧凑的测试集以减少模型测试耗时:

​ ——通过研究视频数量/目标类别/运动类别/重复时间的影响,最终的测试子集包含180个视频,84类移动物体和32种运动形式;除了person类之外,训练视频和测试视频之间的所有对象类都是不重叠的;而对于人而言,训练和测试之间的运动类别并不重叠。每个跟踪器进行3次实验并平均得分以确保可靠的评估。

1546256935374

EXPERIMENTS

Baseline models

⋅\cdot Deep learning based trackers.
​ ——MDNet, GOTURN, CF2, SiamFC, CFNet, SiamFCv2, CFNetc2.

⋅\cdot Correlation filters based trackers.

​ ——CSK, KCF, DAT, LCT, SAMF, DSST, Staple, SRDCF, SRDCFdecon, CCOT, BACF, ECO.

⋅\cdot Traditional trackers.

​ ——LK, IVT, L1APG, MEEM.

Evaluation Methodology

⋅\cdot Average overlap (AO)

    ——GT和算法预测的目标框的overlap的平均值(AUC)。

⋅\cdot Success rate (SR)

​ ——ovelap超过50%的帧数的百分比。

Performance

1546253061084

Evaluation by Challenges

⋅\cdot Occlusion. 可见部分v≤0.6v\le0.6v0.6

⋅​\cdot​ Scale variation. 尺度变化定义为maxisi/minisi​max_i s_i /min_i s_i​maxis

对于获取 GOT-10k 数据集而言,可以通过特定的网盘链接实现下载。该数据集属于大规模的目标跟踪评测集合之一,适用于评估不同视觉追踪算法的效果。 根据已有的资源分享信息,在百度云盘中存在一份包含了多个目标跟踪数据集的合辑,其中包括了所需的 GOT-10k 数据集[^2]。为了访问此资源,需前往指定的百度云盘页面并输入相应的提取码完成文件下载。具体来说,应访问如下链接:`https://pan.baidu.com/s/1D_4pQecJSmjR4ukpfjBh-g` 并使用提取码 `8hej` 来解锁所需的数据集内容。 值得注意的是,考虑到网络环境以及共享链接的有效期等因素的影响,建议尽早尝试下载以确保能够顺利取得数据集用于研究目的。如果遇到任何问题或发现链接失效,则推荐寻找其他官方渠道或者联系相关研究人员寻求帮助。 ```python import os def download_got10k_from_baidu_cloud(save_path, baidu_link="https://pan.baidu.com/s/1D_4pQecJSmjR4ukpfjBh-g", extraction_code="8hej"): """ 使用百度网盘客户端或其他支持命令行操作的方式下载GOT-10k数据集到本地路径 参数: save_path (str): 文件保存的位置 baidu_link (str): 百度网盘分享链接,默认为包含GOT-10k在内的多数据集压缩包地址 extraction_code (str): 解压密码,默认为给定的提取码 返回: None """ # 假设有一个函数可以直接调用百度网盘API进行下载 pan_api.download_file(baidu_link, extraction_code=extraction_code, destination_folder=save_path) # 示例调用 download_directory = "/path/to/save/dataset" if not os.path.exists(download_directory): os.makedirs(download_directory) download_got10k_from_baidu_cloud(download_directory) ```
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值