SEAL: 面向real-SR的全面评估框架(ICLR24)

本文介绍了一种名为SEAL的全新框架,用于系统性评估真实世界超分辨率(real-SR)模型。SEAL通过提出新的评测指标AR和RPR,以及使用聚类和基准线方法,提供了对模型性能的全面理解。实验结果表明,SEAL能有效揭示模型在不同退化情况下的稳定性和一致性,优于随机采样评估。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

SEAL: A FRAMEWORK FOR SYSTEMATIC EVALUATION OF REAL-WORLD SUPER-RESOLUTION (ICLR24)

SEAL是第一个全面的real-SR评估框架,促进了real-SR的发展;

code: https://github.com/XPixelGroup/SEAL

paper: https://arxiv.org/pdf/2309.03020

1、存在的问题

Fig1. Real-ESRGAN中的二阶退化模式
  • 真实世界超分辨率(real-SR)方法专注于处理多样化的真实世界图像。关键思想是使用复杂的高阶退化模型来模拟现实世界的退化。尽管在各种场景下取得了不错的成绩,但仍面临评估的障碍。

  • 目前,一些real-SR方法仅通过从大的退化空间空间中随机选择的一组退化的平均性能来评估模型的性能,无法提供对其整体性能的全面了解,会产生不一致且可能具有误导性的结果。

  • 当面对不同的随机退化时,不同模型表现出不同的性能表现,如上图 (a)。

2、解决方法

  • 提出了两个新的评测指标来更加全面的评测real-SR模型的性能表现,Acceptance Ratio (AR)和Relative Performance Ratio (RPR);

  • 提出了一个新的评估框架SEAL,主要包括了:聚类算法,验收/卓越线以及评估策略;

3、SEAL

Fig2. SEAL的整体算法流程
  • 首先,需要通过聚类算法将退化空间中的退化聚类为K类,然后用K个类中心来生成对应的测试集:

  • 分别设置了一个Acceptance Line和Excellence Line用来表示real-SR的模型性能;

  • Accepetance Line(AL)是在一个小型的网络上训练一个non-blind的模型作为基准,如FSRCNN;

  • Excellence Line (EL) 是在大的网络上训练一个non-blind模型作为基准,如SRResNet;

  • $Q^d$为real-SR模型在$D^{test}$上的性能表现,如PSNR/SSIM;$Q^{ac}$表示AL模型在$D^{test}$的性能表现,$Q^{ex}$表示EL模型在$D^{test}$的性能表现;

Fig3. 由粗到细的SEAL的评估流程

3.1 Acceptance Rate (AR)

  • AR表示real-SR模型可以超过AL的百分比,位于0-1之间;

  • AR表示了一个real-SR模型的基本性能;

3.2 Relative Performance Ratio (RPR)

RPR表示了real-SR模型相对于AL和EL的一个性能指标:

  • \sigma是sigmoid function,RPR_{i} > \sigma(0)=0.5表示了real-SR模型在第i个测试上好于AL;

  • RPR_{i} > \sigma(1)=0.73表示real-SR模型在第i个测试上好于EL;

  • RPR_I表示在大多数退化情况下表现出类似改进的情况,RPR_ARPR在AL之上的均值,RPR_URPR在AL之下的均值;

4、实验

4.1 数据和训练设置

  • 为了验证不同的real-SR真正的性能表现,使用BSRGAN和RealESRGAN模型以相同的概率生成1\times10^{4}种退化对于Set14中的lenna图片;

  • 使用谱聚类的方式,生成100个类中心,然后用类中心的退化设置生成100个测试集合,分别在Set14和DIV2K,表示为Set14-SE和DIV2K_val-SE;

  • 分为MSE-Loss和GAN-Loss的两种模型,GAN的AL和EL模型分别为RealESRGAN和RealHATGAN;

  • 对于AL和EL模型,使用预训练好的模型再进行微调;

4.2 对比实验

对于不同的方法使用SEAL进行评估;

Fig4. 评估指标对比
  • 对于得到的指标,RPR_A小于0.5的不参与排名,Table 2 中的Rank是以AR -> RPR_I为参考的;

  • 相对于其他的评判指标更加的稳定,如PSNR和LPIPS;

和Random随机采样来测试进行对比:

Fig5. 不同Random随机采样的对比测试
  • Table 3 中可以看出对于两个Random的采样数据,BSRNet的性能表现是不一样的,不能表示在整个退化空间上的表现;

  • 在Set14-SE上的测试结果是在整个退化空间上选出的最具代表性的100个test,更加的稳定和可靠;

  • Table 4在DIV2K_val-SE上的结果,也验证了模型性能的一致性,BSRNet的AR指标更高;

4.3 消融实验

谱聚类中心的个数

Fig6. 谱聚类中心个数的消融实验
  • 当类中心大于60时,性能表现趋于稳定,选择100作为类中心的个数;

聚类相似性矩阵的计算  

Fig6. 相似性矩阵计算方式的消融实验
  • 使用图像的直方图来对聚类的结果进行评估相比于MSE和SSIM要更准确;

退化聚类的稳定性

Fig7. 退化聚类时图像个数的消融实验
  • 横轴表示使用多少个图像来进行聚类,计算聚类中心的退化参数;

  • 不同的图像进行聚类,得到的结果是一致的,也验证了SEAL评估框架的稳定性;

4.4 实验效果

LPIPS指标下的可视化结果

Fig8. 实验可视化结果
  • 绿色为AL模型的性能,红色为EL模型的性能,各模型的表现在SEAL下的评估如Fig8;

不同cluster的图像退化程度的一个可视化

Fig9. 不同cluster聚类的退化的可视化结果

  • 不同cluster能够将相似的退化聚类到一起,表明对退化空间聚类的有效性,提取到大的退化空间中重要的退化组。

以太坊是互联网新时代的基础:内建货币与支付。用户拥有个人数据主权,且不会被各类应用监听或窃取数据。人人都有权使用开放金融系统。基于中立且开源的基础架构,不受任何组织或个人控制。以太坊主网于 2015 年上线,是世界头部的可编程区块链。和其它区块链一样,以太坊也拥有原生加密货币,叫作 ether (ETH)。 ETH 是一种数字货币, 和比特币有许多相同的功能。 它是一种纯数字货币,可以即时发送给世界上任何地方的任何人。 ETH 的供应不受任何政府或组织控制,它是去中心化且具稀缺性的。 全世界的人们都在使用 ETH 进行支付,或将其作为价值存储和抵押品。但与其它区块链不同的是,以太坊可以做更多的工作。 以太坊是可编程的,开发者可以用它来构建不同于以往的应用程序。这些去中心化的应用程序(或称“dapps”)基于加密货币与区块链技术, 因而值得信任,也就是说 dapps 一旦被“上传”到以太坊,它们将始终按照编好的程序运行。 这些应用程序可以控制数字资产,以便创造新的金融应用; 同时还是去中心化的,这意味着没有任何单一实体或个人可以控制它们。目前,全世界有成千上万名开发者正在以太坊上构建应用程序、发明新的应用程序,其中有许多现在已经可以使用:加密货币钱包:让你可以使用 ETH 或其他数字资产进行低成本的即时支付金融应用程序:让你可以借贷、投资数字资产去中心化市场:让你可以交易数字资产,甚至就现实世界事件的“预测”进行交易游戏:你可以拥有游戏内的资产,甚至可以由此获得现实收益以及更多,更多。以太坊社区是世界上最大最活跃的区块链社区。它包括核心协议开发者、加密经济研究员、密码朋克、挖矿组织、ETH 持有者、应用开发者、普通用户、无政府主义者、财富 500 强公司,以及现在的你。没有公司或中心化的组织能够控制以太坊。 一直以来,以太坊由多元化的全球性社区贡献者来协同进行维护和改善,社区成员耕耘于以太坊的方方面面,从核心协议到应用程序。 这个网站,就像以太坊的其他部分一样,是由一群人共同构建的,并将持续构建下去。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值