前言
本文为10月9日计算机视觉基础学习笔记——决策层设计总结,分为两节:
一、决策层设计总结
- 矩阵到 onehot 向量的映射:分类;
- 矩阵到 bbox 向量的映射:检测;
- 矩阵到多个 onehot 向量的映射:分割;
- 矩阵到多个 onehot 向量的映射:image caption。
二、YOLO
解决多类目标。

预测了 98 个框后,如何得到最终的 3目标:
- 方法一:聚成 3类,在这 3类中取置信度得分最大的框:
- 如何减少计算量:NMS(非极大值抑制):
- 置信度最高的框为目标,得到第一个框;
- 利用重合度,把与第一个框重合的其他框去掉(抑制);
- 直到没有剩下的框,结束。