Segment anything(SAM)论文及demo使用保姆级教程

最新推荐文章于 2025-10-29 10:09:32 发布

原创

最新推荐文章于 2025-10-29 10:09:32 发布 · 1.7w 阅读

62 ·

CC 4.0 BY-SA版权

文章标签：

#计算机视觉 #深度学习 #人工智能

Meta在论文中发布了新模型Segment Anything Model(SAM)，声称说可以分割一切，可以在任何图像中分割任何物体，论文链接https://arxiv.org/abs/2304.02643

大概看了一遍论文和感受了Meta提供的demo模型，我觉得主要有两个爆点，首先是收集数据的方式，加入了主动学习的形式，因为他的数据集特别大，达到了十亿组数据，那么庞大的数据不可能全部去标注，然后会通过标注一部分然后剩下一部分其他人标，最后加上人工校验部分达到一个区域闭环的效果，当数据集足够庞大时，训练出的模型效果一定就会更好，而且像GPT一样不断更新学习新的数据，模型效果会更好。这个点来说是一个很工程性但是工作量非常大的工作。第二点是有一个prompt的概念，prompt简单来说就是类似于一个“提示词”的概念，其实跟GPT现在那么火和不断提升性能的原因一样。因为ChatGPT用户会给它输入一句话或者一段话来“提示”ChatGPT如何去给出最正确的答案，SAM也同样，在demo示例上SAM首先会自动分割图像中的所有内容，但是如果你输入一个提示词的话，比如一张图片你想让SAM分割出Cat或Dog这个提示词，SAM会自动在照片中猫或者狗周围绘制框并实现分割。

剩下具体的文章内容大家可以点击文章中的链接查看，接下来给大家介绍一下如何使用SAM的demo教程，链接在这http

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

一头懒羊羊

关注关注

7
点赞
踩
62

收藏

觉得还不错? 一键收藏
3
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

【Segment Anything Model】二：论文+代码实战调用SAM模型预训练权重+相关论文

cvxiayixiao的博客

04-22

1万+

上一篇已经全局初步介绍了segment anything model和其功能，本篇作为进阶使用。代码实战案例，同时介绍了二创论文。

Segment Anything论文阅读笔记

qq_33690342的博客

04-07

2503

Segment Anything (SA) project: a new task, model, and dataset for image segmentation.we built the largest segmentation dataset to date (by far), with over 1 billion masks on 11M licensed and privacy respecting images. The model is designed and trained to b

3 条评论您还未登录，请先登录后发表或查看评论

3 条评论

讯飞摸鱼躺平王 2024.01.09
sam有negative prompt吗？比如输入一个点提示该点区域为背景。
- csdnlioon回复讯飞摸鱼躺平王 2024.05.02
  有的，正负两种

优快云-Ada助手 2023.04.14
不知道 Python入门技能树是否可以帮到你：https://edu.youkuaiyun.com/skill/python?utm_source=AI_act_python

【论文解读】Segment Anything 分割一切大模型（附论文地址）

牧子川的博客

04-03

1166

这是一项新的图像分割任务、模型和数据集。我们构建了迄今为止最大的分割数据集，包含超过10亿个掩码，覆盖了1100万张图像。该模型被设计和训练为可提示的（promptable），因此它能够通过提示工程零样本迁移到新的图像分布和任务。我们在众多任务上评估了它的能力，并发现它的零样本性能令人印象深刻——通常与或甚至优于以前的全监督结果。在自然语言处理（NLP）中，提示（prompt）的概念被用来指导语言模型生成特定任务的有效文本响应。

最新发布

j8267643的博客

10-29

929

是由Meta AI Research开发的基础分割模型，能够从输入提示（如点或框）生成高质量的对象掩码，并可用于生成图像中所有对象的掩码。该模型在包含1100万张图像和11亿个掩码的数据集上训练，在各种分割任务上表现出强大的零样本性能。🔗 GitHub地址🎯 核心价值：图像分割 · 零样本学习 · 提示驱动 · 通用分割 · 开源模型项目背景：分割需求：通用图像分割需求增长零样本学习：零样本分割能力需求提示交互：交互式分割应用需求大规模数据。

segment-anything本地部署使用

yunteng521的博客

05-10

2万+

segment-anything本地部署使用

分割一切（SAM）论文详细阅读：Segment Anything

小小帅

02-17

3511

一个用于图像分割的新任务、模型和数据集。通过在数据收集循环中使用我们的高效模型，我们建立了迄今为止最大的分割数据集（迄今为止），其中包含 1100 万张授权图像上的 10 亿多个掩码，并且尊重隐私。该模型的设计和训练具有可提示性，因此它可以在新的图像分布和任务中进行零转移。我们在大量任务中评估了它的能力，发现它的零镜头性能令人印象深刻–通常可与之前的完全监督结果相媲美，甚至更胜一筹。

（SAM）Segment Anything论文精读（逐段解析）

weixin_46248968的博客

07-21

1954

【前沿论文精】Segment Anything项目，包括三个核心创新：1）可提示分割任务设计，支持点击、框选、掩码和文本等多种交互方式，将分割重新定义为条件生成任务；2）Segment Anything Model（SAM）采用三组件架构（图像编码器、提示编码器和掩码解码器），具备处理分割歧义的能力；3）通过数据引擎构建SA-1B数据集，包含1100万图像和10亿掩码，是现有最大分割数据集的400倍。实验表明，SAM在零样本迁移任务中表现优异，甚至超越全监督模型。该工作为计算机视觉基础模型研究提供了新范式。

分割一切(SAM) 论文阅读：Segment Anything

weixin_50946965的博客

05-13

1385

我们介绍了任何片段（SA）项目：一个新的任务，模型和数据集的图像分割。在数据收集循环中使用我们的高效模型，我们建立了迄今为止（到目前为止）最大的分割数据集，在1100万张许可和尊重隐私的图像上拥有超过10亿个掩模。该模型被设计和训练为提示，因此它可以将零拍摄转移到新的图像分布和任务。我们评估了它在许多任务中的能力，发现它的零射击性能令人印象深刻-通常与之前的完全监督结果相竞争甚至优于。

segment-anything2(sam2.1-hiera-tiny)模型

07-28

标题中提到的“segment-anything2(sam2.1-hiera-tiny)模型”，是指 Segment Anything Model（SAM）的2.1版本中的一个轻量级模型，具体是hierarchical类型的tiny版本。SAM模型作为一个创新的图像处理工具，其核心功能...

segment-anything2(sam2.1-hiera-small)模型

07-28

最近，随着Segment Anything Model（SAM）的发布，这个领域又迎来了一项突破性进展。 SAM2.1，即segment-anything的2.1版本，是SAM的最新迭代。SAM2最初在2023年发布，它在图像分割的自动化和灵活性方面树立了新的...

基于 Segment Anything Model 的半自动数据标注工具源码+详细使用教程.zip

09-03

基于 Segment Anything Model 的半自动数据标注工具，只需点击一次即可实现图像分割和标注以及yolo数据格式转换。支持多目标多类别半自动标注。 1. 安装依赖 pip install -r requirements.txt 下载SAM模型,放在 ./...

【论文阅读】Segment Anything（SAM）——可分割一切的CV大模型

糯米丸子TAT的博客

06-11

2181

本研究开发一个可提示的（promptable）模型，在大型数据集上通过特定的任务对其进行预训练，使之具有很强的泛化性，即能够通过提示（prompt）解决新数据集上的一系列下游分割任务。

Segment Anything（论文解析）

qq_22583741的博客

10-17

555

我们介绍了“Segment Anything” (SA) 项目：这是一个新的任务、模型和数据集对于图像分割。使用我们高效的模型进行数据收集，我们构建了迄今为止最大的分割数据集（远远超过其他数据集），其中包含了超过10亿个掩膜，覆盖了1100万张经过许可和尊重隐私的图像。该模型被设计和训练为可提示的，因此可以实现零次学习，适用于新的图像分布和任务。我们在多个任务上评估了它的性能，并发现它的零次学习性能令人印象深刻，通常可以与先前的完全监督结果相竞争甚至更优越。

论文阅读 - Segment Anything

zjuPeco的博客

04-19

4140

本文是对SegmentAnything这篇论文的解读，适合各种基础的人群

【论文阅读笔记】Segment Anything

qq_46056318的博客

03-13

2138

分割任意物体2023年发表在ICCVPaperCodedemo我们介绍Segment Anything（SA）项目：用于图像分割的新任务、模型和数据集。在数据收集循环中使用我们的高效模型，我们构建了迄今为止最大的分割数据集，在1100万张许可和隐私保护图像上拥有超过10亿个掩码。该模型被设计和训练为可提示的，因此它能够在没有见过的图像数据分布和任务上进行零样本学习。我们评估了它在许多任务上的能力，发现它的零样本学习能力令人印象深刻-在某些情况下具有竞争力，甚至可能优于之前的完全监督结果。

论文解读：Segment Anything

weixin_50917576的博客

03-19

2548

我们介绍了任何片段(SA)项目:一个新的任务，模型和数据集的图像分割。在数据收集循环中使用我们的高效模型，我们建立了迄今为止(到目前为止)最大的分割数据集，在1100万张许可和尊重隐私的图像上拥有超过10亿个掩模(本文的mask相当于标注，一个mask相当于一个标签，如标注了一个细胞，标注了一只猪，这就是分别的不同的标签，即mask)。该模型被设计和训练为提示，因此它可以将零拍摄转移到新的图像分布和任务。

【论文精读】Segment Anything

HERODING23的博客

02-22

2018

被称为CV领域的GPT-3的工作，大一统了图像分割领域，实现了可提示及时分割，并且能够实现模糊感知，此外还构建了迄今最大的图像分割数据集，在1100万张授权的隐私图像上超过了10亿个mask。该工作中稿于ICCV 2023，其方法构建、实验设计以及写作格局都值得我们学习。PaperCodeFromICCV 2023本文提出SA项目，包含图像分割领域里新的任务、模型和数据集。作者构建了迄今最大的图像分割数据集，在1100万张授权的隐私图像上超过了10亿个mask。

【论文阅读】Segment Anything论文梳理

magic_ll的博客

03-05

2820

Abstract 我们介绍了Segment Anything（SA）项目：新的图像分割任务、模型和数据集。高效的数据循环采集，使我们建立了迄今为止最大的分割数据集，在1100万张图像中，共超过10亿个掩码。该模型被设计和训练为可提示的的 (promptable)，因此它可以将零样本(zero-shot) 迁移到新的图像分布和任务。我们评估了其在许多任务上的能力，发现其零样本迁移性能十分优秀，与之前的完全监督方法的结果相比，具有竞争力甚至优于这些结果。链接： https://segment-anythin

【图像分割】Segment Anything（Meta AI）论文解读