
人工智能论文精读
文章平均质量分 96
人工智能论文精读
youcans_
电子出版社《数字图像处理—基于OpenCV/Python》作者
展开
-
【youcans论文精读】弱监督深度检测网络(Weakly Supervised Deep Detection Networks)
弱监督检测任务(WSD,Weakly Supervised Detection ) 是指仅使用图像的类别标签来实现目标检测任务。2016年,牛津大学 H. Bilen 等发表论文 “Weakly Supervised Deep Detection Networks(弱监督深度检测网络)”,是 弱监督检测领域 的开山之作原创 2025-04-03 22:24:29 · 426 阅读 · 0 评论 -
【文献阅读】Zotero 新手完全教程:安装、使用与插件
Zotero 作为一款免费开源的文献管理工具,具有强大的功能和灵活的扩展性,特别是可以集成 Deepseek 进行 AI辅助文献阅读。本文针对新手,从安装与配置开始,详细介绍如何利用 Zotero 及其插件打造高效的文献阅读与研究环境。原创 2025-03-13 21:16:04 · 2437 阅读 · 0 评论 -
【异常检测】深度工业图像异常检测调查
综述 "深度工业图像异常检测",本文从神经网络架构、监督级别、损失函数、评价指标和数据集的角度全面审视了基于深度学习的图像异常检测技术,回顾了该技术在工业制造中可适用的场景及可用的 IAD 方法,指出了图像异常检测技术当前面临的若干挑战。原创 2025-03-13 08:00:00 · 1174 阅读 · 0 评论 -
【跟我学YOLO】(1)YOLO12:以注意力为中心的物体检测
本文详细解读 YOLOv12 论文《以注意力为中心的物体检测(YOLOv12: Attention-Centric Real-Time Object Detectors)》。YOLO12 引入了一种以注意力为中心的架构,它不同于以往YOLO 模型中使用的基于 CNN 的传统方法,但仍保持了许多应用所必需的实时推理速度。该模型通过对注意力机制和整体网络架构进行新颖的方法创新,实现了最先进的物体检测精度,同时保持了实时性能。原创 2025-02-22 19:51:41 · 1133 阅读 · 0 评论 -
【医学影像 AI】EyeMoSt+:用于眼科疾病筛查的置信度感知多模态学习框架
一种用于眼科疾病筛查的置信度感知多模态学习框架 EyeMoS𝑡+。 EyeMoS𝑡+ 框架通过融合来自不同来源的信息来提高诊断的准确性,特别是针对糖尿病视网膜病变(DR)、糖尿病性黄斑水肿(DME)和年龄相关性黄斑变性(AMD)等眼科疾病。 通过融合不同模态的信息,并引入置信度感知机制,提高了眼科疾病筛查的准确性和鲁棒性。原创 2025-02-04 08:55:38 · 835 阅读 · 0 评论 -
【医学影像 AI】生成式 AI 基础模型 MINIM(2)研究方法
MINIM整合了多种成像技术(如MRI、CT、眼底影像等)及其对应的文本描述,构建了一个跨模态的生成框架。本文介绍本项目的研究方法,开源项目的安装和使用方法。原创 2025-01-31 10:24:40 · 1071 阅读 · 0 评论 -
【医学影像 AI】生成式 AI 基础模型 MINIM(1)主要结果
一种新的生成式多模态跨器官医学影像基础模型 MINIM,借助文本指令与多种影像技术,它能够合成海量高质量的医学影像数据,大幅提升医学AI的训练效果。Self-improving generative foundation model for synthetic medical image generation and clinical applications 。原创 2025-01-29 07:00:00 · 1969 阅读 · 0 评论 -
【微软:多模态基础模型】(1)从专家到通用助手
2023 年 9 月,微软在 CVPR2023 发表论文「 多模态基础模型:从专家到通用助手 」(Multimodal Foundation Models: From Specialists to General-Purpose Assistants) 。本文全面综述了多模态基础模型的分类和演化,这些模型展示了视觉和视觉语言能力,并重点关注了从专家向通用助手的过渡。原创 2024-11-14 15:52:22 · 1724 阅读 · 0 评论 -
【微软:多模态基础模型】(2)视觉理解
微软在 CVPR2023 发表论文「 多模态基础模型:从专家到通用助手 」(Multimodal Foundation Models: From Specialists to General-Purpose Assistants) 。本文全面综述了多模态基础模型的分类和演化,这些模型展示了视觉和视觉语言能力,并重点关注了从专家向通用助手的过渡。原创 2024-11-14 21:28:19 · 1243 阅读 · 0 评论 -
【微软:多模态基础模型】(3)视觉生成
2023 年,微软在 CVPR2023 发表论文「 多模态基础模型:从专家到通用助手 」(Multimodal Foundation Models: From Specialists to General-Purpose Assistants) 。本文全面综述了多模态基础模型的分类和演化,这些模型展示了视觉和视觉语言能力,并重点关注了从专家向通用助手的过渡。原创 2024-11-16 12:02:49 · 909 阅读 · 0 评论 -
【微软:多模态基础模型】(4)统一视觉模型
2023 年,微软在 CVPR2023 发表论文「 多模态基础模型:从专家到通用助手 」(Multimodal Foundation Models: From Specialists to General-Purpose Assistants) 。本文全面综述了多模态基础模型的分类和演化,这些模型展示了视觉和视觉语言能力,并重点关注了从专家向通用助手的过渡。原创 2024-11-18 14:42:00 · 1113 阅读 · 0 评论 -
【微软:多模态基础模型】(5)多模态大模型:通过LLM训练
2023 年 6 月,微软在 CVPR2023 发表论文「 多模态基础模型:从专家到通用助手 」(Multimodal Foundation Models: From Specialists to General-Purpose Assistants) 。本文全面综述了多模态基础模型的分类和演化,这些模型展示了视觉和视觉语言能力,并重点关注了从专家向通用助手的过渡。原创 2024-11-19 17:47:07 · 1705 阅读 · 0 评论 -
【微软:多模态基础模型】(6)多模态代理:与LLM一起链接工具
2023 年 6 月,微软在 CVPR2023 发表论文「 多模态基础模型:从专家到通用助手 」(Multimodal Foundation Models: From Specialists to General-Purpose Assistants) 。本文全面综述了多模态基础模型的分类和演化,这些模型展示了视觉和视觉语言能力,并重点关注了从专家向通用助手的过渡。本节还包括全书的 568 篇参考文献。原创 2024-11-20 08:00:00 · 1386 阅读 · 0 评论 -
【youcans论文精读】KAN 2.0:面向科学的KAN网络
KAN 2.0 引入带有乘法节点的MultKAN,进一步提高了 KAN 架构的可解释性和通用性。本文精读 KAN2.0 论文,给出 KAN2.0 下载、配置和使用实例的详细步骤。原创 2024-08-23 17:50:19 · 6979 阅读 · 0 评论