硕士毕设-语义分割-4-通过grounding-sam生成效果很好的pesudo

零: 项目说明

是这样的一个事情,经过与deepseek的一番讨论和交流,DeepSeek为我设计了一个30天高强度学习计划,重点聚焦弱监督/无监督语义分割在野外场景的应用,结合理论与实践,并最终导向可落地的开源项目。

主要想法是做基于大模型的弱监督语义分割,主要步骤如下:

  • 自动生成标注:大模型生成图像级标签边框涂鸦点标注等几种弱监督标注类型的标注:
  • 生成伪标签:采用基于类激活图(CAM, Class Activation Mapping)的方法 + CRF后处理,利用分类网络生成伪标签pseudo
  • 训练分割模型:将伪标签作为监督信号,训练U-NetDeepLabv3+等分割网络。

代码在这里:不断改进中:
https://github.com/Tipriest/30Days-for-segmentation


一: 使用grounding-dino model标注地形所在的范围框

1.1 单个正向词汇的标注效果

  1. 原始图片:
    image.png

  2. 给定关键词lawn

  3. grounding-dino模型的标注框
    image.png

  4. sam模型的分割效果
    image.png

1.2单个正向词汇+单个反向词汇的标注效果

  1. 原始图片:
    image.png

  2. 给定关键词yellow brick road without curb

  3. grounding-dino模型的标注框
    image.png

  4. sam模型的分割效果
    image.png

1.3 对于相对复杂的地形图片的标注效果

下面的这张图片中,有两个不连通的黄色砖路:
image.png
prompt给的是yellow brick road without curb,使用grounding dino的标注效果如下图所示
可以看到,这里只标注了一个黄色砖路:
image.png

使用SAM识别的效果如下所示
image.png

如果提示词给的是curb的话,对于这种复杂一些的图片,效果如下所示:
这是原图像:
image.png

这个是标注之后的图像
image.png

这个是sam的结果
image.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值