tracker()函数的作用就是传入video sequence和first frame中的ground truth bbox,然后通过模型,得到后续帧的目标位置,主要通过两个函数实现:init和tracker
- initi:当idx == 0,即传入第一帧图片时,初始化参数,计算一些之后搜索区域的中心等
- tracker:idx不等于0,传入后续的帧,根据网络返回目标的box坐标。
class SiamGATTracker(SiameseTracker): def __init__(self, model): super(SiamGATTracker, self).__init__() self.score_size = cfg.TRACK.SCORE_SIZE #=====25 hanning = np.hanning(self.score_size) self.window = np.outer(hanning, hanning) self.model = model self.model.eval()
训练完train_datasets之后,model要来测试样本了。在model(test_datasets)之前,需要加上model.eval(). 否则的话,有输入数据,即使不训练,它也会改变权值。这是model中含有batch normalization层所带来的的性质。
def init(self, img, bbox):
self.center_pos = np.array([bbox[0]+(bbox[2]-1)/2,
bbox[1]+(bbox[3]-1)/2])

本文详细介绍了SiamGATTracker类的实现,该类用于目标跟踪,通过模型预测目标在视频序列中的位置。核心函数包括init和track,前者用于初始化,后者处理后续帧的跟踪。跟踪过程中考虑了上下文区域、通道平均值、搜索窗口大小和惩罚策略,以适应目标尺度变化。同时,强调了在使用预训练模型进行测试时,需调用model.eval()以避免权重更新。
最低0.47元/天 解锁文章
4252





