
SA网站主页:Segment Anything | Meta AI
论文主页:EfficientSAM
代码地址:https://github.com/yformer/EfficientSAM
官方给的推理代码是CPU版本的,如果想使用GPU推理需要自己修改一下



经过推理测试3090GPU,官方测试图片1072*603 使用框或者点prompts 使用vitt模型需要41-58ms左右,显存7G左右
使用全图分割耗时会更长

本文介绍了EfficientSAM在3090GPU上的测试,使用ViT模型处理1072*603分辨率图像的prompt时,GPU推理大约需要41-58毫秒,占用约7GB显存。全图分割任务则耗时更长。
Wan2.2-I2V-A14B
Wan2.2是由通义万相开源高效文本到视频生成模型,是有50亿参数的轻量级视频生成模型,专为快速内容创作优化。支持480P视频生成,具备优秀的时序连贯性和运动推理能力

SA网站主页:Segment Anything | Meta AI
论文主页:EfficientSAM
代码地址:https://github.com/yformer/EfficientSAM
官方给的推理代码是CPU版本的,如果想使用GPU推理需要自己修改一下



经过推理测试3090GPU,官方测试图片1072*603 使用框或者点prompts 使用vitt模型需要41-58ms左右,显存7G左右
使用全图分割耗时会更长

您可能感兴趣的与本文相关的镜像
Wan2.2-I2V-A14B
Wan2.2是由通义万相开源高效文本到视频生成模型,是有50亿参数的轻量级视频生成模型,专为快速内容创作优化。支持480P视频生成,具备优秀的时序连贯性和运动推理能力
939
5257
1286

被折叠的 条评论
为什么被折叠?