
Speaker Recognition
文章平均质量分 71
sunfoot001
这个作者很懒,什么都没留下…
展开
-
Speaker Recognition: Feature Extraction
1. Short-Term Spectral Features常用的有MFCC, LPCC, LSF, PLP。实际应用中,如何选择哪个特征参数,重要性不如如何做好channel compensation。 2. Voice Source Features常用的有Fundamental frequency, glottal pulse shape。与“Short-Term Sp...原创 2018-11-25 14:03:58 · 695 阅读 · 0 评论 -
Speaker Recognition: GMM-UBM
1. WHY --- 为什么需要使用GMM-UBM来建立Individual Speaker Modeling?"Usually, we do not have much data from a single speaker. In most practical cases related to text-independent scenarios, the enrollment data i...原创 2018-11-25 14:00:24 · 942 阅读 · 0 评论 -
Speaker Recognition: Gaussian probabilistic LDA (PLDA)理解
"MSR Identity Toolbox"里使用到了G-PLDA(Gaussian probabilistic LDA)。根据文献[1]对G-PLDA的原理进行了初步的了解,记录如下。 1. 简化版的G-PLDA的模型定义如公式(3)。这里 是观察向量,m是均值, 是说话人特征子空间矩阵, 是说话人隐变量, 是残差高斯噪声。 2. 根据文献[1],loglikelih...原创 2018-12-15 19:30:57 · 905 阅读 · 0 评论