- 博客(4)
- 收藏
- 关注
原创 Fre-GAN: Adversarial Frequency-consistent Audio Synthesis
本文提出了名为"Fre-GAN"的方法,用于改善神经声码器生成的音频质量。尽管近期的神经声码器研究已经提高了合成音频的质量,但在频率空间仍存在生成音频与实际音频之间的差距。这种差异导致了频谱异响,如嘶嘶声或混响等,并且降低了样本的质量。该方法首先提出了频率连接的生成器和分辨率逐层鉴别器,这有助于在多个频带上学习各种尺度的频谱分布。此外,为了精确重现高频组件,他们在鉴别器中利用了离散小波变换。
2024-03-18 12:17:26
1506
原创 WaveGAN: Frequency-aware GAN for High-Fidelity Few-shot Image Generation
现有的少样本图像生成方法通常在图像或特征级别上采用基于融合的策略来生成新图像。然而,以前的方法很难合成具有精细细节的高频信号,从而降低了合成质量。WaveGAN可以解决该问题,这是一种用于少样本图像生成的频率感知模型。具体来说,其将编码特征分解为多个频率分量,并执行低频跳跃连接以保留轮廓和结构信息。然后,其通过采用高频跳跃连接来减轻生成器合成细节的困难,从而为生成器提供信息丰富的频率信息。此外,其在生成的图像和真实图像上利用频率 L1 损失来进一步阻止频率信息丢失。
2024-03-17 23:21:12
1896
1
原创 哔哩哔哩——知名视频弹幕平台 软件设计与体系结构案例分析
4+1”是由于1995年提出的一种可以通过多种共存的视图描述软件密集型系统架构的视图模型,这些视图基于不同利益相关者的观点。“4+1”由4种基础视图和一些经过挑选的用例或场景(即额外的“+1”视图)组成。提到“4+1”的各种视图,一般都是使用UML来表示,但是实际上“4+1”本身是一种通用的视图模型,并没有限制绘图的记号和工具。它的架构制图思想是:架构需要通过多种视图来描述,而这些视图是来源于不同项目干系人的视点;只有这样才能产生一整套全面、立体且客观的架构描述。
2024-03-08 12:13:51
5486
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人