1.将一幅图像分成S×S个网格,如果某个目标的中心店落在一个网格中,那么这个网格负责预测这个目标
2.每个网格负责预设定的n个目标,返回位置(xywh)和置信度及C个类别的分数(numclass+BG)
3.损失函数:坐标预测 为了区分不同大小的目标的偏移量,加上根号限制。
inputsize 448,448,3 -> 图片分为7X7个网格,每个网格负责预测2个boudingbox(xywh,confidence)和n+1个类别 -> 5+5+10 = 30
1.将一幅图像分成S×S个网格,如果某个目标的中心店落在一个网格中,那么这个网格负责预测这个目标
2.每个网格负责预设定的n个目标,返回位置(xywh)和置信度及C个类别的分数(numclass+BG)
3.损失函数:坐标预测 为了区分不同大小的目标的偏移量,加上根号限制。
inputsize 448,448,3 -> 图片分为7X7个网格,每个网格负责预测2个boudingbox(xywh,confidence)和n+1个类别 -> 5+5+10 = 30