论文梳理 的 复盘

本文探讨了深度学习在图像自动标注领域的应用,包括多模态空间、多区域描述、编码-解码、强化学习及生成式对抗网络等关键技术。同时,文章还涉及了多模态深度学习的四个核心方向,即模态表示、模态传译、模态融合与模态对齐。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文是对自己梳理的论文博客,再重新阅读一遍的总结
原文:论文梳理
博客网站:优快云

斜体」 此符号表示自己对内容有感的批注,当前自己的认知

自己的想法:方向:

  1. 多模态:自动标注,语料库,融合,描述(NLP)
    SVM改进,图片处理,语义鸿沟

  2. 自动标注:

  3. 迁移学习:我认为「迁移学习是过程不是目的,如 做事A用方法ā,现做事B也用方法a」,不构成方向,「迁移学习和主成分分析PCA,同等级,是处理事情的方法」

  4. 题目:[基于深度学习的图像自动标注方法综述],的

    多模态:
    多区域:不同物体区域描述
    编码-解码:
    强化学习:最大似然,反向传播
    生成式对抗:GAN,无监督,生成器+判别器 ,无标签

  5. 多标签分类:

  6. 知识图谱(no)

  7. 人脸识别:图像标注,把人脸部分标注成人脸

  8. 表情识别

图像科研方向进阶:
9. 图像可靠性:图像融合,图像拼接

图像可靠性:你的图像会失真,或者不清晰。你要做的,就是保证图像的清晰度,恢复失真图像,保证图质

  1. 图像理解:图像检索



题目:多模态深度学习综述
关键词(多模态; 深度学习; 神经网络; 模态表示; 模态传译; 模态融合; 模态对齐;)

多模态深度学习:四类:模态表示、模态传译(模态间)、模态融合(多模态 预测 )、模态对齐(元素间关系)


题目:基于深度学习的图像自动标注方法综述
关键词(图像自动标注; 多模态空间; 多区域; 编码-解码; 强化学习; 生成式对抗网络;)

图像自动标注:计算机视觉 + NLP。(底层视觉+高层语义)
五个分类:多模态空间、多区域、编码-解码、强化学习、生成式对抗网络

传统:检索(跟已有的最佳匹配);模版(词槽)
现代:深度学习(自动,非线形,底层转高层;强化学习,生成式对抗,多模态,多区域,编码-解码)

多模态:
多区域:不同物体区域描述
编码-解码:
强化学习:最大似然,反向传播
生成式对抗:GAN,无监督,生成器+判别器 ,无标签


题目:基于深度学习的多模态融合网民情感识别研究

关键词(网民情感; 多模态融合; 情感识别; 双向长短期记忆模型; 微调卷积神经网络; 网络舆情; 舆情监测)

多模态,词向量,特征融合,SVM
图片情感识别:新领域,底层视觉(视觉特征、颜色),中层语义(底层语义鸿沟),深层次(深度学习)


题目:多模态人体动作表示识别及其正骨康复训练应用综述

关键词(动作捕捉; 动作特征提取; 深度学习; 动作识别; 正骨康复训练;)

动作捕捉:基于视频,深度相机,惯性传感器
(难:感知准确度)
动作分类(深度学习):特征自动提取,多模态特征融合
手工:特征 提取,分类
自动:深度学习

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值