- 博客(5)
- 问答 (1)
- 收藏
- 关注
原创 CtxMIM:面向遥感影像理解的上下文增强掩码图像建模
高目标密度给遥感理解中的自监督学习范式带来了挑战,主要体现在以下两个方面:(1) 对比学习中,从同一幅影像增强生成正样本对时,会出现正样本对匹配错误(如图 1(a) 列所示);(2) 重建学习中,随机掩码策略会导致上下文信息缺失(如图 1 (b) 列所示)。图1. 遥感图像中的高目标密度,导致对比学习中正样本对不匹配或重建学习中上下文信息缺失针对这一问题,我们提出 CtxMIM 方法,这是一种创新的基于重建学习的上下文增强自监督表征学习框架。
2025-12-13 12:06:56
774
原创 InfMAE:红外模态下的基础模型
InfMAE 架构由三个主要模块组成:1)掩码块生成模块;2)多尺度编码器模块;3)红外解码器模块。图2:所提出的InfMAE框架。它包含三个模块:掩码块生成模块、多尺度编码器模块和红外解码器模块。多尺度编码器模块中由红色虚线连接的特征被输入到红外解码器模块。
2025-12-06 09:55:34
701
原创 TEDMAE——基于教师引导边缘鉴别器的个性化图掩码自编码器
设GVEG=(V,E)GVE为一个图,其中VVV和EEE分别表示节点和边的集合。A∈RN×NA∈RN×N代表图G的邻接矩阵,其中NNN为节点数量,Aij1A_{ij} = 1Aij1表示节点iii与jjj之间存在边,否则Aij0A_{ij} = 0Aij0。每个节点iii关联一个特征向量xix_ixi。
2025-11-29 13:34:28
628
原创 ColorMAE:探索掩码自编码器中的数据无关掩码策略
题目:ColorMAE: Exploring data-independent masking论文:代码:发表会议:CVPR发表年份:2022 年。
2025-11-09 12:54:18
890
原创 对比掩码自编码器:更强大的视觉学习模型
像素解码器负责根据在线编码器输出的图像令牌(含掩码令牌)学习重建输入图像,特征解码器则学习预测输入图像的特征,以便与动量编码器输出的特征进行对比学习.预训练阶段,动量编码器和投影头的参数通过指数移动平均算法进行更新。而MIM 更注重学习输入图像中的局部关系以完成重建任务,而非建模不同图像间的关系。此外,与典型的对比模型 MoCo-V3 相比,MoCo-V3 在线性探测设置下性能更优,但在部分微调设置下,CMAE 在所有方面都超越了 MoCo-V3,特别是当仅微调 1 个块时,CMAE 提升了 3.8%。
2025-11-08 12:42:40
841
空空如也
编程,第一次使用VScode,
2025-08-11
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅