图像与对话竞赛:成果、挑战与未来方向
1. 包容性图像竞赛
1.1 竞赛目的
为了推动能够对训练时未充分体现的地理位置和文化背景图像进行有效泛化的建模方法的发展,举办了包容性图像竞赛。
1.2 获胜团队表现
以下是获胜团队与在开放图像上训练的基准 Inception V3 模型的性能对比:
| 团队名称 | 阶段 2 F2 分数 |
| — | — |
| 团队 1 (Pavel Ostyakov) | 0.392 |
| 团队 2 (vexcoz) | 0.374 |
| 团队 3 (WorldWideInclusive) | 0.371 |
| 团队 4 (Azat Davletshin) | 0.332 |
| 团队 5 (Artyom Palvelev) | 0.308 |
| 基线 Inception V2 模型 | 0.216 |
从这个表格可以看出,获胜团队的性能明显优于基线 Inception V2 模型。
1.3 调优数据的使用
五支获胜团队中有四支使用了调优数据,用于迁移学习或调整预测阈值。
1.4 模型表现分析
虽然所有方法都能很好地识别图像中的“人”,而不考虑文化背景,但在识别更细微的方面(如“新娘”)时,在训练时被充分识别的文化背景和未被充分识别的文化背景之间仍存在显著差异。
graph LR
A[包容性图像竞赛] --> B[获胜团队表现评估]
超级会员免费看
订阅专栏 解锁全文
5651

被折叠的 条评论
为什么被折叠?



