
实战教程
文章平均质量分 93
分享一些竞赛解决方案或方法的操作教程等。
CVHub
专注多模态视觉语言AI全栈知识分享,提供原创、多领域、有深度的前沿AI论文解读与工业成熟解决方案
展开
-
图像标注神器 X-AnyLabeling v2.5.0 重磅发布 | 通用视觉任务全新升级,交互式视觉-文本提示功能全面上线!
随着人工智能技术的飞速发展,X-AnyLabeling 作为一款集多功能于一体的图像标注软件,致力于为用户提供更高效、更智能的标注解决方案。笔者深知,在实际应用中,用户面临着多样化的标注需求和复杂的数据处理挑战。因此,笔者将力争在有限的资源不断开发、探索和整合最新的算法模型,并优化工作流,以期帮助用户简化标定流程,提升标定效率。X-AnyLabeling 从项目启动至今,始终秉承开放和合作的精神,并欢迎来自各地的开发者和用户共同参与到项目的建设中来。原创 2024-12-19 22:03:23 · 1351 阅读 · 0 评论 -
Segment Anything 2 (SAM2) in X-AnyLabeling: 构建快速精准的图像和视频标注对象分割工具
Segment Anything 2 (SAM2) in X-AnyLabeling: 构建快速精准的图像和视频标注对象分割工具原创 2024-09-07 19:49:03 · 3321 阅读 · 0 评论 -
MICCAI STS 2024牙齿半监督分割挑战赛
在这里根据综述文献STS MICCAI 2023 Challenge: Grand challenge on 2D and 3D semi-supervised tooth segmentation给大家介绍一下去年STS 2023牙齿分割挑战赛的一些优秀的解决方案。具体来说,去年有434支团队注册了挑战,其中64支团队在最后阶段提交了有效结果。在满足进入最终阶段的所有标准的方法中,所有方法都基于深度学习方法进行,其中,伪标签生成方案是最常用的半监督策略——超过一半的团队采用。原创 2024-07-31 21:33:17 · 1041 阅读 · 0 评论 -
精度最高降幅60%!SOTA只是假象?CVPR2024 Highlight为你揭示CLIP和LLaVA-Next等模型“骗局”
ImageNet-D数据集包含来自113个数据类别的4835张图像,有着不同的背景(background)、纹理(texture)和材料(material)组成. 和以往的合成数据集相比,ImageNet-D图像质量更高,且生成更为灵活可控。实验结果表明,ImageNet-D数据集有效地降低state-of-art模型的测试准确率,降低幅度最高达60%,包括CLIP,MiniGPT-4和LLaVa-NeXT等。ImageNet-D从一个崭新的角度揭露了当前大模型的错误,有利于启发模型的进一步迭代。原创 2024-04-16 21:04:08 · 967 阅读 · 0 评论 -
AI标注神器 X-AnyLabeling-v2.3.0 发布!支持YOLOv8旋转目标检测、EdgeSAM、RTMO等热门模型!
原创 2024-01-19 21:55:14 · 6242 阅读 · 9 评论 -
打破遮挡和数据稀缺难题:MMSports 2023 分割竞赛冠军方案分享!
在这篇技术报告中,我们介绍了用于解决 ACM MMSports 2023 实例分割问题的关键方法和技术。为了解决分割任务中的遮挡问题,作者利用了性能优异的 HTC 架构,搭载特征提取能力较强的 CBSwin-Base 骨干网络,并引入了一种新颖的位置感知复制粘贴数据增强技术,可以随意应用于数据稀缺的分割应用。实验结果表明,本文方法在不需要额外数据或预训练的情况下,在测试集上实现了最先进的结果(以0.533的OM得分排名第一)。原创 2023-11-04 22:40:11 · 216 阅读 · 0 评论 -
【2023-2024年最新教程】yolov5_obb: 旋转目标检测从数据制作到终端部署全流程教学
旋转目标检测,从入门到起飞,一站式教程!原创 2023-11-04 12:55:24 · 12737 阅读 · 30 评论 -
手把手教你打榜 MICCAI 2023 最新挑战赛!(附代码实现)
本文提出了一种名为 YONA 的新框架,用于准确和快速检测结肠镜视频中的息肉。该框架通过引入前景和背景对齐模块来处理快速运动情况下的特征,同时引入跨帧对比学习模块来增强模型对息肉和肠壁的区分能力。实验证明,YONA 在三个大规模公开视频息肉检测数据集上取得了最先进的性能。原创 2023-06-18 13:19:54 · 1074 阅读 · 0 评论 -
Github 3k+ stars 南科大 VIP Lab 近期开源 Track-Anything | SAM + VOS: 一键视频标注
本文方法主要是基于已有算法组装成一个pipeline,下面简单介绍下几个主要成员。原创 2023-05-04 00:28:13 · 727 阅读 · 0 评论 -
告别手动标注时代 | SAM 助力 Label-Studio 形成 SOTA 级半自动标注工具
到此半自动化标注就完成了, 通过 Label-Studio 的半自动化标注功能,可以让用户在标注过程中,通过点击一下鼠标,就可以完成目标的分割和检测,大大提高了标注效率。我们通过下面的方式下载好示例的喵喵图片,点击 Data Import 导入需要标注的猫图片,点击 Save 创建 Project。用 vscode 打开解压后的文件夹,可以看到标注好的数据集,包含了图片和 json 格式的标注文件。注意:此处导出的只有边界框的标注,如果想要导出实例分割的标注,需要在启动 SAM 后端服务时设置。原创 2023-05-03 23:49:12 · 1871 阅读 · 8 评论 -
实战教程 | ECCV 2022 Out Of Distribution 分类赛道冠军方案解读
本文开头通过一个形象生动的案例为大家介绍了 OOD 任务的重要性,继而引申出今天的主角——关于计算机视觉中的域外分布泛化性问题。同时,也很荣幸的为大家简单讲解了本次 ECCV 2022 关于 OOD-CV 挑战赛中图像分类和目标检测赛道的冠军解决方案,希望对大家能有所启发。如果您也对人工智能和计算机视觉全栈领域感兴趣,强烈推荐您关注有料、有趣、有爱的公众号『CVHub』,每日为大家带来精品原创、多领域、有深度的前沿科技论文解读及工业成熟解决方案!原创 2023-03-24 00:06:25 · 423 阅读 · 0 评论 -
CVHub手把手帮你榨干GPU的显存
如果您也对人工智能和计算机视觉全栈领域感兴趣,强烈推荐您关注有料、有趣、有爱的公众号『CVHub』,每日为大家带来精品原创、多领域、有深度的前沿科技论文解读及工业成熟解决方案!欢迎添加小编微信号:cv_huber,一起探讨更多有趣的话题!本文正在参加 人工智能创作者扶持计划。原创 2023-03-23 21:10:38 · 258 阅读 · 0 评论