本文是对自己梳理的论文博客,再重新阅读一遍的总结
原文:论文梳理
博客网站:优快云
「斜体」 此符号表示自己对内容有感的批注,当前自己的认知
自己的想法:方向:
-
多模态:自动标注,语料库,融合,描述(NLP)
SVM改进,图片处理,语义鸿沟 -
自动标注:
-
迁移学习:我认为「迁移学习是过程不是目的,如 做事A用方法ā,现做事B也用方法a」,不构成方向,「迁移学习和主成分分析PCA,同等级,是处理事情的方法」
-
题目:[基于深度学习的图像自动标注方法综述],的
多模态:
多区域:不同物体区域描述
编码-解码:
强化学习:最大似然,反向传播
生成式对抗:GAN,无监督,生成器+判别器 ,无标签 -
多标签分类:
-
知识图谱(no)
-
人脸识别:图像标注,把人脸部分标注成人脸
-
表情识别
图像科研方向进阶:
9. 图像可靠性:图像融合,图像拼接
图像可靠性:你的图像会失真,或者不清晰。你要做的,就是保证图像的清晰度,恢复失真图像,保证图质
- 图像理解:图像检索
题目:多模态深度学习综述
关键词(多模态; 深度学习; 神经网络; 模态表示; 模态传译; 模态融合; 模态对齐;)
多模态深度学习:四类:模态表示、模态传译(模态间)、模态融合(多模态 预测 )、模态对齐(元素间关系)
题目:基于深度学习的图像自动标注方法综述
关键词(图像自动标注; 多模态空间; 多区域; 编码-解码; 强化学习; 生成式对抗网络;)
图像自动标注:计算机视觉 + NLP。(底层视觉+高层语义)
五个分类:多模态空间、多区域、编码-解码、强化学习、生成式对抗网络
传统:检索(跟已有的最佳匹配);模版(词槽)
现代:深度学习(自动,非线形,底层转高层;强化学习,生成式对抗,多模态,多区域,编码-解码)
多模态:
多区域:不同物体区域描述
编码-解码:
强化学习:最大似然,反向传播
生成式对抗:GAN,无监督,生成器+判别器 ,无标签
关键词(网民情感; 多模态融合; 情感识别; 双向长短期记忆模型; 微调卷积神经网络; 网络舆情; 舆情监测)
多模态,词向量,特征融合,SVM
图片情感识别:新领域,底层视觉(视觉特征、颜色),中层语义(底层语义鸿沟),深层次(深度学习)
关键词(动作捕捉; 动作特征提取; 深度学习; 动作识别; 正骨康复训练;)
动作捕捉:基于视频,深度相机,惯性传感器
(难:感知准确度)
动作分类(深度学习):特征自动提取,多模态特征融合
手工:特征 提取,分类
自动:深度学习