Building Bridges across Spatial and Temporal Resolutions: Reference-Based Super-Resolution via Chang

最新推荐文章于 2025-06-04 18:45:04 发布

尔呦

最新推荐文章于 2025-06-04 18:45:04 发布

阅读量813

点赞数 9

分类专栏： paper reading 文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_44994838/article/details/143140086

版权

paper reading 专栏收录该内容

22 篇文章

订阅专栏

问题引入

输入ref image(同一地区不同时刻的高分遥感图像)和LR image得到对应的HR image；

methods

land cover change priors是pixel level multi category change detection mask，包含no change class和不同的land cover change classes，在训练的时候使用的是gt的mask，在推理的时候可以使用相关的change detection methods来得到对应的mask；
change aware encoder：基础结构遵循EDM文章，其中输入的noisy latents concat上了LR image + Ref image + land cover change mask；
change aware decoder：ref image + land cover change mask在decoder部分也介入了，unchange区域reference texture guided denoising，在changed区域进行semantics guided denoising，特征进行融合的部分是semantics guided spatial feature transform(SFT) module，具体实现如下 $F_{i + 1} = \gamma_i(F_e\oplus F_i)\cdot F_i + \beta_i(F_e\oplus F_i)$ ，其中 $F_{i + 1},F_i$ 分别是SFT module的输出输入， $F_e$ guided feature， $\gamma_i(\cdot),\beta_i(\cdot)$ 分别是spatially adaptive weight and bias；
在训练的时候LR是isotropic Gaussian blur, anisotropic Gaussian blur, motion blur, resize with different interpolation methods, additive Gaussian noise, and JPEG compression noise来合成的；

实验

数据：SECOND是一个semantic change detection dataset，其中包含7land cover class annotations，分别是non vegetated ground surface, tree, low vegetation, water, buildings, playgrounds, and unchanged areas，使用2668张训练，1200张进行测试；CNAM-CD dataset：也是一个change detection dataset，包含6个类别，分别是bare land,vegetation, water, impervious surfaces (buildings, roads, parking lots, squares, etc.), others (clouds, hard shadows, clutter, etc.), and unchanged area，从谷歌地球上收集，2258张训练，1000张测试；
eval：LPIPS+FID

博客等级

码龄6年

160
原创

1124
点赞

1068
收藏

735
粉丝

关注

私信

热门文章

分类专栏

paper reading 22篇
Super Resolution 28篇
cvpr23 7篇
video generation 23篇
Basic 13篇
遥感 1篇
自然语言处理 15篇
外语 4篇
图像处理 16篇
模式识别 8篇
统计学习方法 11篇
算法 4篇
论文 1篇
高级人工智能 2篇
离散数学 4篇
刷题 1篇
java 4篇

展开全部收起

上一篇：: Plug-and-Play Diffusion Features for Text-Driven Image-to-Image Translation

最新评论

Real-World Image Variation by Aligning Diffusion Inversion Chain
尔呦: 我在实验的时候发现直接使用X_R^T作为X_G^T的初始化也可以直接实现图像裂变的效果，以及这种初始化方式在一些training free的图像编辑工作中也可以看见，整体来看，使得X_G^T的分布和X_R^T一致会对保持参考图片有帮助，我猜测这也许是本文第二个创新点使用这种初始化的初衷，第二个创新点的第二个小点，CFG那块也有保持分布对其的意思；
Real-World Image Variation by Aligning Diffusion Inversion Chain
我曾经喂头发拼搏过: 请问这个公式6，明明说与正态分布不一致，为什么公式还是在X R上做采样呢
Pixel-Aware Stable Diffusion for Realistic Image Super-Resolution and Personalized Stylization
优快云-Ada助手: 恭喜你这篇博客进入【优快云每天值得看】榜单，全部的排名请看 https://bbs.youkuaiyun.com/topics/619116502。
DreamPose: Fashion Image-to-Video Synthesis via Stable Diffusion
优快云-Ada助手: 恭喜你这篇博客进入【优快云每天值得看】榜单，全部的排名请看 https://bbs.youkuaiyun.com/topics/618777589。
Deep Learning for Single Image Super-Resolution: A Brief Review
优快云-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.youkuaiyun.com/skill/python?utm_source=AI_act_python

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。