CV-1-目标检测-03-RCNN-01-RCNN模型搭建思路.txt

本文详细介绍了使用SS算法选取候选框ROI并保存图像,通过ALexNet模型微调进行特征提取,利用SVM和回归模型进行分类与位置回归,实现视觉目标的精确检测与定位。
部署运行你感兴趣的模型镜像
一、将图像使用SS选取候选框ROI,并将ROI图像(2000)保存到磁盘中。
    图像信息:区域图像,区域坐标,ROI区域和GT的IOU值,ROI区域对应的GT的类别ID,tx/ty/tw/th回归转换系数。

二、基于ALexNet的特征提取网络,做模型微调。
    训练数据构建:
        train_x : 区域图像
        train_y: 类别标签ID
            正例:IOU大于等于0.5
            负例:IOU小于0.5

三、SVM分类器的训练数据生成
    使用第二步训练好的ALexNet模型对所有的区域图像进行前向过程的预测,将FC7层的特征输出作为SVM训练的原始特征信息

四、SVM分类器的训练
    训练数据构建:
        train_x : 区域图像所对应的FC7层的高阶特征(4096的向量)
        train_y: 类别标签ID
            正例:GT真实边框
            负例:IOU在[0.1, 0.3]

五、回归模型的训练数据生成
    使用训练的ALexNet模型对所有区域图像进行预测(前向过程),将Conv5层的特征输出作为训练回归模型的原始特征信息。

六、回归模型训练
    训练数据构建:
        train_x : 区域图像所对应的Conv5层的高阶特征
        train_y: 转换系数tx/ty/tw/th
            参与模型训练的数据要求:IOT必须大于0.6



您可能感兴趣的与本文相关的镜像

Llama Factory

Llama Factory

模型微调
LLama-Factory

LLaMA Factory 是一个简单易用且高效的大型语言模型(Large Language Model)训练与微调平台。通过 LLaMA Factory,可以在无需编写任何代码的前提下,在本地完成上百种预训练模型的微调

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值