- 博客(49)
- 资源 (4)
- 收藏
- 关注
原创 【论文笔记之 GTCRN】A Speech Enhancement Model Requiring Ultralow Computational resources
本文对 Xiaobin Rong 等人于 2024 年在 ICASSP 上发表的论文进行简单地学习。如有表述不当之处欢迎批评指正。欢迎任何形式的转载,但请务必注明出处。
2025-04-04 20:24:04
1020
1
原创 【论文笔记之 Mega-TTS2】Boosting Prompting Mechanisms For Zero-Shot Speech Synthesis
本文对 Ziyue Jiang 等人于 2024 年发表的论文进行简单地翻译。如有表述不当之处欢迎批评指正。欢迎任何形式的转载,但请务必注明出处。
2025-01-01 23:32:41
1153
1
原创 【论文笔记之 VALL-E】Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers
本文对 Chengyi Wang 等人于 2023 年发表的论文进行简单地翻译。如有表述不当之处欢迎批评指正。欢迎任何形式的转载,但请务必注明出处。
2025-01-01 23:12:45
673
1
原创 【论文笔记之 TFDAF】A Unified Approach to Time- and Frequency-Domain Realization of FIR Adaptive Digital(下)
本文对 GREGORY A. CLARK 等人于 1983 年在 IEEE Transactions on Acoustics, Speech, and Signal Processing 上发表的论文进行简单地翻译。如有表述不当之处欢迎批评指正。欢迎任何形式的转载,但请务必注明出处。
2024-12-24 20:23:28
1128
1
原创 【论文笔记之 TFDAF】A Unified Approach to Time- and Frequency-Domain Realization of FIR Adaptive Digital(上)
本文对 GREGORY A. CLARK 等人于 1983 年在 IEEE Transactions on Acoustics, Speech, and Signal Processing 上发表的论文进行简单地翻译。如有表述不当之处欢迎批评指正。欢迎任何形式的转载,但请务必注明出处。
2024-12-24 18:49:30
885
1
原创 【论文笔记之 TF-GridNet】Making Time-Frequency Domain Models Great Again For Monaural Speaker Separation
本文对 Zhong-Qiu Wang 等人于 2023 年在 ICASSP 上发表的论文进行简单地翻译,如有表述不当之处欢迎批评指正。欢迎任何形式的转载,但请务必注明出处。
2024-12-16 18:15:03
866
1
原创 【论文笔记之 PYIN】PYIN, A Fundamental Frequency Estimator Using Probabilistic Threshold Distributions
本文对 Matthias Mauch 和 Simon Dixon 等人于 2014 年在 ICASSP 上发表的论文进行简单地翻译。如有表述不当之处欢迎批评指正。欢迎任何形式的转载,但请务必注明出处。
2024-03-11 22:57:37
1749
1
原创 【论文笔记之 YIN】YIN, a fundamental frequency estimator for speech and music
本文对 Alain de Cheveigne´ 等人于 2002 年在 The Journal of the Acoustical Society of America 上发表的论文进行简单地翻译。如有表述不当之处欢迎批评指正。欢迎任何形式的转载,但请务必注明出处。
2024-02-26 19:06:49
1528
1
原创 【读书笔记之 DAE】动态范围控制
本文介绍了音频信号处理中的动态范围控制,主要包括 compressor, expander, limiter 和 noise gate。
2024-01-30 15:35:06
1051
原创 聊聊音频信号处理中一个不太起眼的算法-limiter
文章较全面地介绍了两种 limiter 的实现方法,两种方法的不同之处在于增益因子的平滑方式,两种方法各有优缺点,可根据具体应用选择相应的方法。
2024-01-30 15:26:09
2491
原创 python之读取、写入 excel 文件
本文主要讨论如何使用 python 读取、写入 excel 文件。如有表述不当之处欢迎批评指正。欢迎任何形式的转载,但请务必注明出处。
2022-11-29 22:47:05
5548
原创 计算 tensorflow 和 pytorch 模型的浮点运算数
本文主要讨论如何计算 tensorflow 和 pytorch 模型的 FLOPs。如有表述不当之处欢迎批评指正。欢迎任何形式的转载,但请务必注明出处。
2022-11-22 22:52:29
2496
5
原创 【论文笔记之 BLMS】Block Implementation of Adaptive Digital Filters
本文对 GREGORY A. CLARK 于 1981 年在 IEEE Transactions on Circuits and Systems 上发表的论文进行简单地翻译。如有表述不当之处欢迎批评指正。欢迎任何形式的转载,但请务必注明出处。
2022-11-14 17:47:42
1198
1
原创 【论文笔记之 FDAF and MAF】Frequency-Domain and Multirate Adaptive filtering
本文对 John J. Shynk 于 1992 年在 IEEE Signal Processing Magazine 上发表的论文进行简单地翻译。如有表述不当之处欢迎批评指正。欢迎任何形式的转载,但请务必注明出处。
2022-07-15 20:11:47
1235
3
原创 【论文笔记之 NLMS】A Learning Method for System Identification
本文对 JIN-ICHI KAGUMO 和 ATSUHIKO NOD4 于 1967 年在 IEEE Transactions on Automatic Control 上发表的论文进行简单地翻译。如有表述不当之处欢迎批评指正。欢迎任何形式的转载,但请务必注明出处。
2022-07-11 10:47:11
1593
2
原创 【论文笔记之 APA】An adaptive filtering algorithm using an orthogonal projection to an affine subspace ...
本文对 Kazuhiko Ozeki 等人于 1984 年在 Electronics and Communications in Japan (Part I: Communications) 上发表的论文进行简单地翻译。如有表述不当之处欢迎批评指正。欢迎任何形式的转载,但请务必注明出处。
2022-06-13 17:07:02
549
2
原创 【论文笔记之 MDF】Multidelay Block Frequency Domain Adaptive Filter
本文对 JIA-SIEN SOO 和 KHEE K. PANG 于 1990 年在 IEEE Transactions on Acoustics, Speech, and Signal Processing 上发表的论文进行简单地翻译。如有表述不当之处欢迎批评指正。欢迎任何形式的转载,但请务必注明出处。......
2022-06-01 22:36:38
2664
7
原创 【论文笔记之 UFLMS】Unconstrained Frequency-Domain Adaptive Filter
本文对 DAVID MANSOUR 等人于 1982 年在 IEEE Transactions on Acoustics, Speech, and Signal Processing 上发表的论文进行简单地翻译。如有表述不当之处欢迎批评指正。欢迎任何形式的转载,但请务必注明出处。
2022-05-24 15:37:50
501
1
原创 【论文笔记之 CLMS】The Complex LMS Algorithm
本文对 B. Widrow 等人于 1975 年在 Proceedings of the IEEE 上发表的论文进行简单地翻译。如有表述不当之处欢迎批评指正。欢迎任何形式的转载,但请务必注明出处。
2022-04-27 13:49:57
2050
2
原创 【论文笔记之 AFiFD】Adaptive Filtering in the Frequency Domain
本文对 MAURO DENTINO 等人于 1978 年在 PROCEEDINGS OF THE IEEE 上发表的论文进行简单地翻译。如有表述不当之处欢迎批评指正。欢迎任何形式的转载,但请务必注明出处。
2022-04-26 20:57:10
669
1
原创 【论文笔记之 FLMS】Fast Implementation of LMS Adaptive Filters
本文对 EARL R. FERRARA 于 1980 年在 IEEE Transactions on Acoustics, Speech, and Signal Processing 上发表的论文进行简单地翻译。如有表述不当之处欢迎批评指正。欢迎任何形式的转载,但请务必注明出处。
2022-04-26 16:27:59
1790
1
原创 谈谈音频信号处理中 CNN 的因果性
本文对笔者关于 CNN 因果性的理解作以记录。如有表述不当之处欢迎批评指正。欢迎任何形式的转载,但请务必注明出处。
2022-04-15 17:37:50
5969
13
原创 【论文笔记之 SN-Net】Interactive Speech and Noise Modeling for Speech Enhancement
本文对 Chengyu Zheng 于 2021 年在 AAAI 上发表的论文进行简单地翻译。如有表述不当之处欢迎批评指正。欢迎任何形式的转载,但请务必注明出处。
2022-01-24 17:16:09
4470
5
原创 【论文笔记之 Conv-TasNet】Surpassing Ideal Time–Frequency Magnitude Masking for Speech Separation
本文对 Yi Luo 于 2019 年在 IEEE/ACM Transactions on Audio, Speech, and Language Processing 上发表的论文进行简单地翻译。如有表述不当之处欢迎批评指正。欢迎任何形式的转载,但请务必注明出处。
2020-06-30 16:11:25
22263
25
原创 【论文笔记之 RNNoise】A Hybrid DSP/Deep Learning Approach to Real-Time Full-Band Speech Enhancement
本文对 Jean-Marc Valin 于 2018 年在 MMSP 上发表的论文进行简单地翻译。如有表述不当之处欢迎批评指正。欢迎任何形式的转载,但请务必注明出处。
2020-06-10 22:31:19
3597
6
原创 【论文笔记之 Speech Separation Overview】Supervised Speech Separation Based on Deep Learning-An Overview
本文对汪徳亮于 2017 年在 IEEE/ACM Transactions on Audio, Speech, and Language Processing 上发表的论文进行简单地翻译,如有表述不当之处欢迎批评指正。欢迎任何形式的转载,但请务必注明出处。
2020-06-02 15:49:00
5954
11
原创 有参考音质评估:基于 sisnr 的语音噪声分离
本文对工作过程中遇到的音质评估问题作以记录。如有表述不当之处欢迎批评指正。欢迎任何形式的转载,但请务必注明出处。
2020-03-31 11:29:44
900
1
原创 音频编解码之 G7221 解码器
本文对 G.722.1 的解码器作以介绍,如有表述不当之处欢迎批评指正。欢迎任何形式的转载,但请务必注明出处。
2020-03-28 23:13:24
2578
1
原创 音频编解码之 G7221 编码器
本文对 G.722.1 的编码器作以介绍,如有表述不当之处欢迎批评指正。欢迎任何形式的转载,但请务必注明出处。
2020-03-28 14:17:11
5086
2
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人