
论文源码解读
文章平均质量分 89
牧锦程
硬性的标准其实限制不了无限可能的我们,所以啊!少年们加油吧!AI算法与电子竞赛
展开
-
【论文解读】Segment Anything 分割一切大模型(附论文地址)
这是一项新的图像分割任务、模型和数据集。我们构建了迄今为止最大的分割数据集,包含超过10亿个掩码,覆盖了1100万张图像。该模型被设计和训练为可提示的(promptable),因此它能够通过提示工程零样本迁移到新的图像分布和任务。我们在众多任务上评估了它的能力,并发现它的零样本性能令人印象深刻——通常与或甚至优于以前的全监督结果。在自然语言处理(NLP)中,提示(prompt)的概念被用来指导语言模型生成特定任务的有效文本响应。原创 2025-04-03 09:00:00 · 941 阅读 · 0 评论 -
【论文解读】Pose2Seg:无检测人体实例分割(附论文地址)
本文提出了一种基于人体姿态的实例分割框架,该框架不依赖于目标检测,而是直接基于人体姿态进行实例分割。该框架在处理遮挡情况下的人体实例分割问题上,比现有的基于检测的方法更准确。作者还引入了一个名为“Occluded Human (OCHuman)”的新基准数据集,专注于标注被遮挡的人体,包括边界框、人体姿态和实例掩码。引言研究背景与动机计算机视觉领域中与人类相关的研究日益增多,尤其是在多人姿态估计和人体实例分割方面。原创 2025-03-07 10:44:56 · 858 阅读 · 0 评论 -
【论文源码实战】YOLO+3D Bounding Box:实现对目标的3D框绘制
《3D Bounding Box Estimation Using Deep Learning and Geometry》展示了如何从单一视图中恢复已知对象类别的3D边界框。通过使用新颖的MultiBin损失进行方向预测和有效地选择边界框尺寸作为回归参数,该方法能够在没有额外的3D形状模型或复杂预处理管道的情况下估计稳定且准确的3D边界框。提出了未来的研究方向,包括将立体视觉和视频序列信息整合到方法中。原创 2025-01-08 13:36:57 · 760 阅读 · 0 评论 -
【论文源码实战】CRNN:基于图像序列识别的端到端可训练神经网络
CRNN模型,即卷积递归神经网络(Convolutional Recurrent Neural Network),是一种结合了卷积神经网络(CNN)和递归神经网络(RNN)优势的深度学习模型。CRNN模型专为处理图像中的序列识别任务而设计,尤其擅长于场景文本识别。原创 2024-11-19 09:51:06 · 1384 阅读 · 0 评论 -
【论文源码实战】NTS-Net模型:自监督机制实现细粒度分类
NTS-Net通过其创新的多代理合作学习方案,能够有效地解决了细粒度分类中的挑战,通过自监督机制自动定位图像中的信息区域,并利用这些区域的特征进行准确的分类预测。NTS-Net能够准确地识别出不同狗类的细微差异,如毛的颜色、形状和纹理等。在进行训练后,分类的准确率也很高,速度也不错。原创 2024-11-18 16:03:01 · 440 阅读 · 0 评论 -
【论文源码实战】EdgeYOLO: 边缘设备友好的无锚框检测器
EdgeYOLO是一个为边缘计算设备优化的实时目标检测器,它以较低的计算成本实现了高效率和高精度的目标检测,特别是在小目标识别方面表现出色。模型设计简洁,易于在边缘设备上部署,并且通过开源协作,支持社区进行进一步的改进和定制。此外,它还提供了不同规模的模型以适应不同的计算环境需求。关注公众号,回复:edgeyolo,即可获取edgeyolo相关代码、论文、预训练模型、使用方法示例等【论文源码实战】EdgeYOLO: 边缘设备友好的无锚框检测器硬性的标准其实限制不了无限可能的我们,所以啊!原创 2024-11-02 10:36:40 · 1249 阅读 · 0 评论 -
【论文源码实战】轻量化MobileSAM,分割一切大模型出现,模型缩小60倍,速度提高40倍
从结果来看,MobileSAM相比于SAM,模型整体体积缩小了60倍,运行速度提高40倍,但分割效果却保持相当水平。个人认为,这对于视觉大模型在移动端的部署与应用是具有里程碑意义的。关于MobileSAM模型的相关代码、论文PDF、预训练模型、使用方法关注公众号,回复:MobileSAM,即可获取MobileSAM相关代码、论文、预训练模型、使用方法示例等。原创 2024-04-20 04:11:37 · 3541 阅读 · 5 评论