前言
以下内容主要介绍DETR训练过程中数据集的传入到dataloader的生成全过程。
构建训练数据集
进入CocoDetection类,首先执行make_coco_transform函数,返回一个组合的图像变换对象:
img 和 打包好的target 传入self.prepare即ConvertCocoPolysToMask类
退出ConvertCocoPolysToMask,返回image和target(bbox+label)
进入make_coco_transforms中封装好的几个数据增强方式:
最后返回的img 是张量形式 还有target