去年4月,Meta公布了一款名为SAM(Segment Anything Model)的技术,这是一个用于图像分割的AI大模型,会对图像进行观察、感知、思考、逻辑推理、得出结果,且操作极其简单。
我们邀请到台湾交通大学博士,多篇顶会一作作者Shawn老师为我们带来——“分割万物”的超强SAM模型,详解SAM模型的过去和未来的优化改进方向!
扫码免费参与课程
赠导师推荐50+最新SAM论文&ppt原稿
(文末福利)
2023最新50+SAM模型论文展示
课程讲师:Shawn老师
-台湾交通大学PHD
-以第一作者发表多篇论文,包括ICLR、ICDE等
-获多项校级奖学金,AI竞赛,并与新加坡科技部有合作
-研究方向: 深度学习,计算机视觉,音乐生成,多模态
课程大纲
1、SAM模型的劣势
2、SAM模型改进方向
3、SAM模型改进方法
扫码免费参与课程
赠导师推荐50+最新SAM论文&ppt原稿
(文末福利)
2023最新50+SAM模型论文展示
SAM 是一个提示型模型,其在 1100 万张图像上训练了超过 10 亿个掩码,实现了强大的零样本泛化。许多研究人员认为「这是 CV 的 GPT-3 时刻,因为 SAM 已经学会了物体是什么的一般概念,甚至是未知的物体、不熟悉的场景(如水下、细胞显微镜)和模糊的情况」,并展示了作为 CV 基本模型的巨大潜力。
它可以根据点、框、文本等输入形式,生成图像中所有对象的高质量掩模(Mask)。
然而,sam模型仍有很多改进的方向,譬如,模型参数量较大,推理时间较长,对于某些特殊的目标分割效果较差(裂缝,阴影,医学影像等),无法分割复杂的物体结构,细粒度不足等问题。针对这些问题,仍有很大的改进空间。
扫码免费参与课程
赠导师推荐50+最新SAM论文&ppt原稿
近期,PyTorch 团队表示,他们重写了 Meta 的「分割一切」 (SAM) 模型,从而使代码比原始实现快 8 倍,并且没有损失准确率,所有这些都是使用原生 PyTorch 进行优化的。
PyTorch 团队发现 SAM 有两个地方可以优化:
第一个是对 aten::index 的长调用,这是由张量索引操作(例如 [])产生的底层调用导致的。然而实际上 GPU 花费在 aten::index 上的时间相对较低,原因在于 aten::index 在启动两个内核的过程中,两者之间发生了阻塞 cudaStreamSynchronize。这意味着 CPU 会等待 GPU 完成处理,直到启动第二个内核。因而为了优化 SAM,本文认为应该致力于消除导致空闲时间的阻塞 GPU 同步。
第二个是 SAM 在矩阵乘法中花费了大量的 GPU 时间,这在 Transformers 中很常见。如果能够减少 SAM 模型在矩阵乘法上花费的 GPU 时间,我们就可以显着加快 SAM 的速度。
对于还没有发过第一篇论文,还不能通过其它方面来证明自己天赋异禀的科研新手,学会如何写论文、发顶会的重要性不言而喻。
发顶会到底难不难?近年来各大顶会的论文接收数量逐年攀升,身边的朋友同学也常有听闻成功发顶会,总让人觉得发顶会这事儿好像没那么难!
但是到了真正实操阶段才发现,并不那么简单,可能照着自己的想法做下去并不能写出一篇好的论文、甚至不能写出论文。掌握方法,有人指点和引导很重要!
还在为创新点而头秃的CSer,还在愁如何写出一篇好论文的科研党,一定都需要来自顶会论文作者、顶会审稿人的经验传授和指点。
很可能你卡了很久的某个点,在和学术前辈们聊完之后就能轻松解决。
右滑查看近期学员中稿部分展示
扫码二维码
免费与大牛导师1v1meeting
🎉喜报!!
沃恩智慧在
2023回响中国 腾讯新闻•教育频道年度论坛中
荣膺2023年度知名在线教育科研品牌
沃尔得旗下沃恩智慧成立至今已有近20年的历史,我们坚持“树立科研信心,传递科研价值”的教学使命,凭借优质的产品、完善的服务、良好的口碑荣膺2023年度知名在线教育科研品牌,此次沃恩智慧脱颖而出荣膺2023年度知名在线教育科研品牌,感谢腾讯新闻·教育频道对我们价值的肯定,也感谢学员对我们的支持和认可,我们会一直保持初心,砥砺前行!
文末福利
小沃整理了沃恩智慧联合创始人Paul老师的精品系列付费课程,原价3999元,现0元免费领,包含计算机领域各方向热点内容及论文写作技巧干货!
立即扫码 赠系列课程
-END-