
VLN论文阅读
文章平均质量分 87
记录读研时阅读的视觉语言导航方向的论文
巷猫和斑马
这个作者很懒,什么都没留下…
展开
-
idea探索2:Unifying Top-down and Bottom-up Scanpath Prediction Using Transformers
之前的视觉注意力预测方法只能进行top-down(目标驱动)或bottom-up(外部刺激驱动)中的一个。本文提出了一个Human Attention Transformer(HAT)。HAT使用了一种新的和一个,共同创造了一个类似于人类动态视觉工作记忆的时空意识。HAT不仅在预测目标存在和目标不存在的视觉搜索以及“无任务”自由观看期间所做的注视的扫描路径方面建立了一种新的最先进的技术,而且还使。与依赖于固定单元的粗网格并且由于固定离散化而经历信息丢失的先前方法不同,HAT具有。原创 2024-11-14 11:52:47 · 1066 阅读 · 0 评论 -
Room-to-Room论文阅读(VLN Datasets)
以前的方法在处理机器人自然语言命令问题时,常常忽视了视觉信息处理的重要性。逐渐将一个(识别和理解真实世界中的任何物体),简化为一个(只识别和理解预先定义好的、有限的物体集合)这种方法减少了机器人需要处理和识别的物体多样性,从而降低了问题的难度和实际应用的范围。但同时限制了机器人在现实世界中的适应性和能力。原创 2024-10-22 21:28:57 · 1498 阅读 · 1 评论 -
DL领域术语
深度学习领域学习的术语记录原创 2024-04-28 11:26:43 · 412 阅读 · 1 评论 -
VLN论文阅读记录01-RCM and SIL for VLN
2019年CVPR文章阅读原创 2024-10-22 12:06:20 · 1151 阅读 · 1 评论