1.目标检测算法:(用一个框框出目标)

2.语义分割算法:标出属于猫的像素点

————————————————————————————
二者区别:

Mask-R-CNN实例分割算法可以结合两者优点
————————————————————————————
3.防止失真和保证语义效果的精确,会在图像边缘加上灰条,同时保证图像边长可以整除2的六次方

4.图片传入主干特征提取网络,当输入的图片为1024 X 1024时,我们会获得多个特征公用层,相当于将图片划分成不同的网格,每个网格有不同的相应框,利用RPN区域建议网络,我们可获得相应框的调整参数和框内是否包含物体,此时我们获得建议框

建议框可以在特征图上进行截取,截取到的部分特征层就可以反映原图中的不同区域,截取到的图再传入ROI Align中,ROI Align将截取到的图resize到相同大小后利用分类或者回归网络判断截取到的内容是否包含目标,并对建议框进行调整。调整之后就是预测

本文详细介绍了目标检测算法Mask-R-CNN的工作原理和技术细节。从输入图像到最终的目标检测及实例分割,涵盖特征提取、建议框生成、ROIAlign层的作用及分类回归模型的应用等关键步骤。
最低0.47元/天 解锁文章
1124

被折叠的 条评论
为什么被折叠?



