BigVGAN

文章目录

method

  • Snake激活函数,relu-改成周期激活函数,周期是可学习参数;对域外的周期信号鲁棒性更好;
  • Anti-aliased Representation抗锯齿优化:snake 激活函数在引入周期性的时候,也会带来不可控的高频伪影,为了优化这一点,网络进行2x upsample & 2x downsample 操作,每个操作伴随低通滤波,【奈奎斯特-香农定理】,将 snake+filter 用于每一个residual dilated convolution layers
    • 根据奈奎斯特-香农采样定理,信号的采样频率必须至少是信号最高频率的两倍,以避免混叠(aliasing)。当周期激活函数(如Snake)引入高频伪影时,可通过以下步骤消除:
      • 2倍上采样:将信号采样率提升至原频率的两倍,使原信号中的高频成分在新采样率下的奈奎斯特频率(原采样率)范围内,从而避免混叠。
        低通滤波:在上采样后,使用截止频率为新奈奎斯特频率的低通滤波器,去除高于该频率的成分,确保信号中无高频伪影。
        2倍下采样:将信号恢复至原始采样率,此时信号中已无混叠成分,高频伪影被有效消除。

在这里插入图片描述

traning trick

  • snack+filter 会放大the gradient norm of MPD. Consequently, 将梯度裁剪设置为 1 0 3 10^3 103
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值