
论文阅读
文章平均质量分 65
总结
crazy637
JUST DO IT CRAZY
展开
-
关于怎么读论文
关于怎么读论文原创 2022-06-03 21:52:27 · 223 阅读 · 0 评论 -
基于标题的视频摘要
论文名TVSum: Summarizing Web Videos Using Titles《基于标题的视频摘要》会议名称&时间2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR)数据集SumMe & TVSum研究问题基于视频标题生成视频摘要研究方法/相关技术研究框架:镜头分割-》规范的视觉概念学习-》镜头重要性评分-》摘要生成摘要生成流程: 视频镜头获取(均匀分割视频段),镜头原创 2021-06-20 11:56:14 · 529 阅读 · 0 评论 -
基于用户视频创建视频摘要
题目《Creating Summaries from User Videos》《基于用户视频创建视频摘要》会议名称&时间2014 ECCV会议数据SumMe数据集研究问题视频摘要生成研究方法/相关技术将视频分割为超帧(可切段)。然后,预测每个超帧的兴趣度(使用低阶特征和人脸/人、地标检测器和运动特征),从中选择一个最优子集。主要关注视频中特征明显的帧:如建筑物、颜色鲜明的物体。创新提出基于兴趣度的超帧(能作为视频摘要的备选)。思考1、若视频中明显特征少怎么获取超级帧?原创 2021-06-16 15:38:25 · 483 阅读 · 0 评论 -
具有多样-代表性奖励机制的无监督视频摘要深度强化学习
题目《Deep Reinforcement Learning for Unsupervised Video Summarization with Diversity-Representativeness Reward》《具有多样-代表性奖励机制的无监督视频摘要深度强化学习》期刊/会议名称(时间)2018 AAAI会议数据SumMe、TVSum视频数据集公开视频数据集:视频数据集源代码:论文源代码研究问题基于无监督视频摘要的生成研究方法(相关技术)1、提出基于深度强化学习的视频摘要网络原创 2021-05-25 21:26:54 · 848 阅读 · 1 评论 -
基于内容选择和融合的生成式摘要级联方法
题目《A Cascade Approach to Neural Abstractive Summarization with Content Selection and Fusion》《基于内容选择和融合的生成式摘要级联方法》会议名称&时间2020 ACL会议数据“CNN”/“DM”数据集(获取数据)“CNN”数据集:来自“CNN”新闻文章的文档和附带的问题。大约有9万份文档和38万个问题。”DM“(Daily Mail)数据集:”Daily Mail“新闻文章中的文档和附带的问题原创 2021-05-15 11:21:58 · 173 阅读 · 0 评论 -
用于非对齐多模态语言序列的多模态转换器
目录用于非对齐多模态语言序列的多模态转换器研究问题研究方法创新点数据集技术介绍输出思考用于非对齐多模态语言序列的多模态转换器研究问题多模态情况下,各个模态的信息存在互补,另外也存在信息冗余,因此如何进行有效融合?现在关于多模态的情感分析研究中,都是通过对齐各模态的特征,在时间序列上进行融合。eg:获取 words 的 time-stamps(时间戳), 然后将audio和visual的信息对齐到 word,再将audio和visual的特征对齐到word。然而强调一致性一是在技术上存在挑原创 2021-04-23 21:32:54 · 1144 阅读 · 0 评论 -
基于多头注意力机制的模型层融合维度情感识别
目录基于多头注意力机制的模型层融合维度情感识别研究问题研究方法技术介绍输出基于多头注意力机制的模型层融合维度情感识别研究问题多模态下情感识别,需要解决多种模态怎么进行融合。常用的有三种方式,特征层融合、决策层融合、模型层融合。目前研究大部分采用的是前两种融合方式(决策方式用得更多),但这两种方式都存在较大弊端。特征层:只是对各个模态的情感特征进行简单拼接,并没有考虑到模态之间的信息交互。决策层:虽然解决了不同模态之间的时序不同步问题,但是没有考虑到不同模态的情感特征信息的关联。第三种方式解决了原创 2021-04-13 16:46:20 · 2474 阅读 · 0 评论 -
基于交互注意力机制的多模态情感识别算法
基于交互注意力机制的多模态情感识别算法研究问题多模态机制下的情感识别,在多模态下,需要提取大量的特征。但特征数量多,造成一是训练参数增大。二是产生噪声,关键信息被遗漏。在模型融合时,要关注主要特征,因此需引入注意力机制。研究方法文章研究文本+语音的多模态。提出的多交互注意力机制网络:GATASA(Global Acoustic-to-text and Acoustic-to-Self Acoustic to Text) 。两(互补)部分组成:1、GATA :强调所有的信息。2、ASATA:强调局部信原创 2021-04-11 10:03:57 · 3356 阅读 · 0 评论 -
多模态连续维度情感识别
目录0. 题目1. 研究问题2. 采用方法3. 优缺点4. 思考点0. 题目《Multi-modal Conditional Attention Fusion for Dimensional Emotion Prediction》《基于多模态条件注意融合机制的多模态情感预测》1. 研究问题 “离散”:数据不可再分,比如:计数(1、2、3…)、分类(A/B/C/D)、等级数据(1/2/3) ”连续“:数据可再分(提高精度可以量出更多位数),比如:身高 情感分析在组成形式上可以分为:单原创 2021-03-30 15:10:20 · 1716 阅读 · 1 评论