论文笔记
文章平均质量分 84
21级的乐未央
人工智能学院的程序小猿一枚~
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
论文阅读(九)Locality-Aware Zero-Shot Human-Object Interaction Detection
这篇论文是笔者在组会上汇报的,所以直接放演示的PPT了。论文来源:CVPR(2025)论文中没有提及对显卡的要求。原创 2025-08-12 09:44:17 · 250 阅读 · 1 评论 -
论文阅读(八)Bilateral Collaboration with Large Vision-Language Models for Open Vocabulary HOI Detection
双边协作机制:首次建立 HOI 检测器与 VLMs 的双向引导,HOI 检测器提供注意力偏差细化 VLM 特征,VLM 通过 LLM 提供细粒度监督,解决特征粗粒度与协作不足问题。细粒度特征生成:ABG 利用 HOI 检测器的交互注意力,使 VLMs 聚焦于特定人类 - 物体交互区域,生成实例级特征。token 级监督:LSG 通过 LLM 对 caption 的逐 token 预测,强化对动词、名词的监督,避免传统方法的粗糙监督缺陷。效率优化:冻结 VLM 参数并在推理时丢弃 LLM,平衡性能与计算成本。原创 2025-07-24 14:48:28 · 912 阅读 · 0 评论 -
论文阅读(七)ERNet: An Efficient and Reliable Human-Object Interaction Detection Network
高效架构:结合 EfficientNetV2 和 MSDA,实现低复杂度、快速收敛的特征聚合,解决传统 Transformer 效率问题。自适应令牌生成:DA 模块生成实例和交互令牌,替代可学习嵌入,加速收敛并增强特征针对性。鲁棒性优化:通过渐进式学习、ASL 损失等缓解长尾分布和过拟合问题。不确定性估计:引入 MC 采样量化预测可靠性,提升复杂场景下的决策准确性。原创 2025-07-23 11:37:56 · 667 阅读 · 0 评论 -
论文阅读(六)Open Set Video HOI detection from Action-centric Chain-of-Look Prompting
通过动作中心的链式提示机制,显式建模动作语义和时序动态。原创 2025-06-01 11:08:04 · 1304 阅读 · 0 评论 -
论文阅读(五)Efffcient Adaptive Human-Object Interaction Detection withConcept-guided Memory
(2023)原创 2025-05-24 16:14:24 · 1128 阅读 · 0 评论 -
论文阅读(四):Agglomerative Transformer for Human-Object Interaction Detection
论文来源:ICCV(2023)项目地址:https://github.com/six6607/AGER.git。原创 2025-05-18 16:43:54 · 1018 阅读 · 0 评论 -
论文阅读(三):Exploring the Potential of Large Foundation Models for Open-Vocabulary HOIDetection
论文来源:CVPR(2024)原创 2025-03-23 21:11:18 · 953 阅读 · 0 评论 -
论文阅读(二):Learning from Observer Gaze: Zero-Shot Attention Prediction Oriented by HOI Recognition
首次将注意力预测从物体 / 人类层级提升到。原创 2025-03-09 17:37:21 · 711 阅读 · 0 评论 -
论文阅读(一):FGAHOI: Fine-Grained Anchors for Human-ObjectInteraction Detection
本文提出了一种新的基于变换器(transformer)的模型FGAHOI(Fine-Grained Anchors for Human-Object Interaction Detection),用于检测人体-物体互动(HOI)。目标是提高HOI检测的准确性,特别是在复杂背景、远距离和小目标等挑战下。原创 2025-02-28 11:37:39 · 759 阅读 · 0 评论
分享