自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 《Hierarchical Conditional Relation Networks for Video Question Answering》论文精读

视频问答(VideoQA)具有挑战性,因为它需要建模能力来提取动态视觉元素、远距离关系,并将它们与语言概念关联起来。我们引入了一个通用的可重用神经单元,称为条件关系网络(CRN),作为构建用于视频表示和推理的更复杂结构的基础模块。CRN以张量对象数组和一个条件特征作为输入,并计算编码后的输出对象数组。模型构建变成了复制、重新排列和堆叠这些可重用单元的简单练习,用于多样化的模态和上下文信息。因此,这种设计支持高阶关系和多步推理。

2024-04-18 21:02:36 1776

原创 《Knowledge Graphs Meet Multi-Modal Learning: A Comprehensive Survey》论文整理

知识图谱驱动的多模态学习多模态知识图谱首先,文章将分别提供知识图谱和多模态知识图谱的形式化定义,并探讨它们的构建过程。接着,文中详细讨论了知识图谱驱动的多模态学习在图像分类和视觉问答等任务中的应用。此外,也对多模态知识图谱的相关任务进行了阐述,如多模态知识图谱的构建和实体对齐等。最后,文章提供了这些研究任务的定义和评估基准,并概述了进行这些研究的基本见解。文章首先提出文献第一类类似于条件反射。

2024-04-14 18:39:47 2360 1

原创 《Knowledge Graphs Meet Multi-Modal Learning: A Comprehensive Survey》论文整理

知识图谱驱动的多模态学习多模态知识图谱首先,文章将分别提供知识图谱和多模态知识图谱的形式化定义,并探讨它们的构建过程。接着,文中详细讨论了知识图谱驱动的多模态学习在图像分类和视觉问答等任务中的应用。此外,也对多模态知识图谱的相关任务进行了阐述,如多模态知识图谱的构建和实体对齐等。最后,文章提供了这些研究任务的定义和评估基准,并概述了进行这些研究的基本见解。第一类类似于条件反射。

2024-04-14 00:16:41 1541 1

原创 24级准研究生的自我修养——自我介绍篇

24届准研究生(23年参加保研夏令营)由于还没有到9月份正式结束保研,所以目前个人情况暂时不公开,等到保研正式结束再更新背景。目前情况为已经跟中国科学院计算技术研究所的老师签完双选,打算在23年暑假提高一下自己的专业能力,暑假后续将从一些简单小工具的使用方法开始学习。后续可能会从Latex的使用方法开始学习,暑假还想出去玩一玩所以进度可能较慢qwq。

2023-07-27 14:13:40 87 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除