|
|
Summary
Abstract: 语者识别即为判断说话的人是不是他的使用者。本组用基于 VQ 的语者识别系统系统模型,通过提取 Mel 倒谱系数,制作模板码本与测试者相应参数进行对比,根据阈值判断,差别最小的则认为匹配原训练模板,即测试者与训练者为同一人,否则认为不是同一人。通过此过程实现语者识别功能。在功能上分为两大部分,语者判定以及实施辨别。
Contents 1.Introduction 3
-
- 语者识别的概念 3
- 特征参数的提取 4
- 用矢量量化聚类法生成码本 4
- VQ 的说话人识别 5
- The Program 6
- Introduction
关于语者识别:在生物辨识技术中,语者辨识是利用人类最自然的口语表达作为辨识身分的依据。语者辨识一般分为语者识别及语者确认,前者是要辨识说话者是谁,后者则是判断说话的人是不是他所宣称的使用者,本项目的研究主题是后者。语者确认常被视为一个假说测定问题,利用似然比例测试方法来解:空假说表示说话者为真正的使用者,替代假说表示其为冒充者。我们可以收集特定使用者的语音数据来训练空假说模型,但替代假说牵涉未知的冒充者,较难模型化。针对此点,传统的作法是收集很多人的语音,训练一个通用背景模型,或是几位与目标使用者声音相似的人的语音,训练数个背景模型,再利用取极大值、取极小值、算数平均或几何平均等方法来结合个别的模型分数。
基于 VQ 的语者识别系统系统模型
基于 VQ 的说话人识别系统,矢量量化起着双重作用。在训练阶段,把每一个说话者所提取的特征参数进行分类,产生不同码字所组成的码本。在识别(匹配)阶段,我们用 VQ 方法计算平均失真测度(本系统在计算距离 d 时,采用欧氏距离测度),从而判断说话人是谁。
语音识别系统结构框图如图 1 所示。
|
|
图 1 语音识别系统结构框图
-
- 语者识别的概念
语者识别就是根据说话人的语音信号来判别说话人的身份。语音是人的自然属性之一,由于说话人发音器官的生理差异以及后天形成的行为差异,每个人的语音都带有强烈的个人色彩,这就使得通过分析语音信号来识别说话人成为可 能。用语音来鉴别说话人的身份有着许多独特的优点,如语音是人的固有的特征, 不会丢失或遗忘;语音信号的采集方便,系统设备成本低;利用电话网络还可实现远程客户服



最低0.47元/天 解锁文章
1688

被折叠的 条评论
为什么被折叠?



