- 博客(237)
- 资源 (1)
- 收藏
- 关注
原创 【CVPR24】OmniMedVQA: 一种新的医疗LVLM大规模综合评估基准
论文介绍论文: OmniMedVQA: A New Large-Scale Comprehensive Evaluation Benchmark for Medical LVLM代码: https://github.com/OpenGVLab/Multi-Modality-Arena会议与年份:CVPR24全文概述本篇论文介绍了针对医疗领域的视觉问答任务(Medical VQA)的新基准测试集——...
2024-11-29 18:04:38
926
原创 【CVPR24】One-Prompt to Segment All Medical Images
论文介绍论文: One-Prompt to Segment All Medical Images代码: https://github.com/KidsWithTokens/one-prompt会议与年份:CVPR24全文概述本文介绍了一种新的医疗图像分割方法—One-Prompt Segmentation。传统的分割方法需要用户在推理阶段为每个样本提供提示或使用有标签的数据进行迁移学习,但这些方法...
2024-11-28 21:43:13
944
1
原创 【NIPS24】【Open-Ended Object Detection】VL-SAM
论文:https://arxiv.org/abs/2410.05963代码:暂未提供摘要本文介绍了一种名为VL-SAM的训练免费框架,用于解决开放性物体检测和分割任务。该框架结合了通用对象识别模型(MLLM)和通用对象定位模型(SAM),并通过使用注意力映射作为提示连接这两个通用模型。实验结果表明,VL-SAM在LVIS数据集上的表现优于之前的方法,并且可以在真实世界应用中提供额外的实例分割掩模。...
2024-10-26 20:56:16
1097
原创 GenerativeU:生成式开放目标检测
论文:https://arxiv.org/abs/2403.10191代码:https://github.com/FoundationVision/GenerateU感想目标检测任务已经逐渐从闭集场景专项开集场景,在LLM加持下,速读越来越快。该方法仍然依赖于预先定义的类别,这意味着它无法完全摆脱先验知识。尽管在论文中提到不需要确切对象类别知识。整体脑图摘要本文介绍了一种新的目标检测方法——生成式...
2024-10-22 20:02:42
805
原创 【ECCV24】【红外目标检测】IRSAM
论文:https://arxiv.org/abs/2407.07520代码:https://github.com/IPIC-Lab/IRSAM点评这篇文章将SAM用于红外图像目标的识别。核心创新点是引入边缘和多尺度信息,但其实也是很常见的了。边缘的提取借鉴的Perona-Malik理论。摘要最近的“任意分割模型”(SAM)是自然图像分割领域的一项重大进步,具有强大的零样本性能,适用于各种下游图像分...
2024-10-06 16:07:21
4011
原创 【MM24】【水下目标分割】Dual_SAM
论文:https://arxiv.org/abs/2404.04996代码:https://github.com/Drchip61/Dual_SAM点评这篇文章介绍的改进SAM,面向海洋生物的分割。但是海洋图像易受噪声影响,论文中仅是通过一个gamma变换减弱了这种影响。双主干网络的参数量并没有提及,但我猜估计不小,但性能提升并不是很高,同时堆了不少料,属于力大砖飞的工作。引言部分前三段都是一些老...
2024-09-11 22:00:52
1543
原创 【MM24】【显著目标检测】MDSAM
Multi-Scale and Detail-Enhanced Segment Anything Model for Salient Object Detection论文:https://arxiv.org/abs/2408.04326代码:https://github.com/BellyBeauty/MDSAM0 摘要显着对象检测(SOD)旨在识别和分割图像中最显着的对象。先进的 SOD 方法通...
2024-09-04 22:34:31
673
原创 【图像处理小知识】PIL Image 中的P和L模式
P模式是一种索引颜色图像模式,它使用一个调色板(Palette)来存储图像的颜色信息。调色板是一个包含颜色索引和对应颜色值的列表。在P模式下,每个像素的值表示其在调色板中的索引,而不是实际的颜色值。:L模式是一种灰度图像模式,它仅存储图像的亮度信息,而不包含颜色信息。在PIL(Python Imaging Library)中,P模式和L模式是两种不同的图像模式,用于表示图像的。对于Mask图而言,每个颜色通常表示一个物体,而物体的种类是有限的,不需要太大的表达空间,因此可以用P模式。
2024-04-03 14:51:25
1108
原创 【Python】python中getattr的使用
这在动态获取属性值的场景中非常有用,特别是当属性名称在运行时才确定时。例如下面这段代码,只有在运行时(即传进来的name不同时)才能确定out_channels和conv_kernel_size的大小。如果指定的属性存在,则返回属性的值;如果属性不存在,并且提供了默认值,则返回默认值;如果属性不存在且没有提供默认值,则会引发 AttributeError 异常。是一个内置函数,用于获取对象的属性值。
2024-03-07 10:33:58
303
原创 【BUG解决】vscode debug python launch.json添加args不起作用
为了带入参数调试python 程序,点击了ui界面右上角的debug按钮,配置了lauch.json文件。按照网上搜到的教程添加了但是点击ui界面的debug按钮,发现配置的参数并不起作用。
2023-07-13 10:00:28
2394
原创 【TCSVT22】Pareto Refocusing for Drone-view Object Detection【航拍目标检测】
无人机目标检测
2023-02-25 09:54:42
1000
原创 【目标检测】LLA: Loss-aware label assignment for dense pedestrian detection【标签分配】
LLA: Loss-aware Label Assignment for Dense Pedestrian Detection
2022-11-27 15:31:53
919
原创 【BUG解决】Yolov7训练 yolov7-e6e 出现IndexError: list index out of range
Train failed on yolov7-e6e IndexError: list index out of range
2022-08-14 13:39:27
3342
12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人