视觉显著性计算:去除训练中的标签歧义
1. 不同视频类型的显著性计算表现
在视觉显著性计算中,不同视频类型的场景复杂度对算法性能有显著影响。从相关研究结果来看,大多数方法在“视频游戏”类型的视频中表现最佳。这是因为“视频游戏”场景通常具有明显的显著目标,这些目标很容易与干扰项区分开来。玩家在游戏过程中,常常会调整场景,如改变视角和角色位置,以确保目标能够突出显示。此外,“视频游戏”的场景相对其他视频类型(如“电视新闻”)更为简单,这有助于显著性计算。
| 视频类型 | 特点 | 对显著性计算的影响 |
|---|---|---|
| 视频游戏 | 有明显显著目标,玩家可调整场景,场景相对简单 | 利于显著性计算,算法表现佳 |
| 电视新闻 | 场景复杂,包含主播、字幕、滚动文本、标志等多种内容 | 难以仅用视觉特征区分目标和干扰项,算法表现差 |
| 体育 | 场景复杂 | 难以仅用视觉特征区分目标和干扰项,算法表现差 |
与之相反,大多数算法在“电视新闻”和“体育”类型的视频中表现最差。原因在于这些类型的场景比其他视频类型更为复杂。例如,“新闻”场景可能包含主播、字幕、滚动文本、标志等多种内容,这些内容都可能成为显著目标。在这种
超级会员免费看
订阅专栏 解锁全文
13

被折叠的 条评论
为什么被折叠?



