基于高斯混合模型的说话人验证系统实现
一、说话人验证概述
说话人验证(Speaker Verification),也称为说话人认证,其任务是验证给定的语音片段是否属于特定的说话人。在说话人验证系统中,存在一个未知的其他说话人集合,因此需要将语音属于验证目标的可能性与不属于的可能性进行比较。这与说话人识别任务不同,说话人识别任务会计算每个说话人的可能性并进行比较。说话人验证和说话人识别都可以是文本相关或文本无关的。本文将介绍如何使用高斯混合模型/通用背景模型(GMM - UBM)创建一个文本相关的说话人验证系统。
二、使用预训练的通用背景模型进行说话人验证
- 加载数据
首先,我们需要加载预训练的通用背景模型(UBM)、配置好的音频特征提取器对象以及用于归一化特征的归一化因子。
load speakerVerificationExampleData.mat ubm afe normFactors
- 注册说话人
如果想测试自己注册,可以将enrollYourself设置为true,系统会提示你多次录制说“stop”的音频。增加录制次数可以提高验证准确性。
enrollYourself = true;
if enrollYourself
numT
超级会员免费看
订阅专栏 解锁全文
855

被折叠的 条评论
为什么被折叠?



