yolo_v1 2016
特点
45FPS
448*448
63.4mAP
思想
- 输入的图片,物体提前会被人为标注好。真实框
- 经过yolo处理后把图像分成s*s个grid cell
- 每个gridcell会有二个bounding box,bounding box的大小是人为根据经验设定的
- 每个bound ing box会计算得到5个参数,4个位置参数(回归调整预测框大小),和一个confidence值(置信度)
- 二个bounding box会分别计算与真实框的iou(交并比),选择iou大的作预测框
- 在所有cell中,置信度值高表示是该grid cell内是物体留下,否则就舍弃
- 这样预测框会选择大iou的,置信度低的gridcell的预测框会被舍弃,调整之后就得到了正确的预测框
每个grid cell要预测B个bounding box(这里是2),每个bounding box除了要预测位置之外,还要预测一个confidence值(置信度,表示该cell内是不是物体),每个网格还要预测C个类别的分数(每个bounding box要预测5个值,4个位置参数x,y,w,h和一个confidence值)