Matlab 基于 VQ 的语者识别系统(含所有代码)

Matlab 基于 VQ 的语者识别系统 ( 含所有代码 )

Summary

Abstract: 语者识别即为判断说话的人是不是他的使用者。本组用基于 VQ 的语者识别系统系统模型,通过提取 Mel 倒谱系数,制作模板码本与测试者相应参数进行对比,根据阈值判断,差别最小的则认为匹配原训练模板,即测试者与训练者为同一人,否则认为不是同一人。通过此过程实现语者识别功能。在功能上分为两大部分,语者判定以及实施辨别。

Contents        1.Introduction 3

    1. 语者识别的概念 3
    2. 特征参数的提取 4
    3. 用矢量量化聚类法生成码本 4
    4. VQ 的说话人识别 5
  1. The Program 6

    1. 函数关系 6
    2. 代码说明 6
      1. 函数 mfcc 6
      2. 函数 disteu 6
      3. 函数 vqlbg 7
      4. 函数 test 8
      5. 函数 testDB 8
      6. 函数 train 9
      7. 函数 melfb 9
  1. Results & Discussion 10
  2. Further Work 12

  1. Introduction

关于语者识别:在生物辨识技术中,语者辨识是利用人类最自然的口语表达作为辨识身分的依据。语者辨识一般分为语者识别及语者确认,前者是要辨识说话者是谁,后者则是判断说话的人是不是他所宣称的使用者,本项目的研究主题是后者。语者确认常被视为一个假说测定问题,利用似然比例测试方法来解:空假说表示说话者为真正的使用者,替代假说表示其为冒充者。我们可以收集特定使用者的语音数据来训练空假说模型,但替代假说牵涉未知的冒充者,较难模型化。针对此点,传统的作法是收集很多人的语音,训练一个通用背景模型,或是几位与目标使用者声音相似的人的语音,训练数个背景模型,再利用取极大值、取极小值、算数平均或几何平均等方法来结合个别的模型分数。

基于 VQ 的语者识别系统系统模型

基于 VQ 的说话人识别系统,矢量量化起着双重作用。在训练阶段,把每一个说话者所提取的特征参数进行分类,产生不同码字所组成的码本。在识别(匹配)阶段,我们用 VQ 方法计算平均失真测度(本系统在计算距离 d 时,采用欧氏距离测度),从而判断说话人是谁。

语音识别系统结构框图如图 1 所示

图 1 语音识别系统结构框图

    1. 语者识别的概念

语者识别就是根据说话人的语音信号来判别说话人的身份。语音是人的自然属性之一,由于说话人发音器官的生理差异以及后天形成的行为差异,每个人的语音都带有强烈的个人色彩,这就使得通过分析语音信号来识别说话人成为可 能。用语音来鉴别说话人的身份有着许多独特的优点,如语音是人的固有的特征, 不会丢失或遗忘;语音信号的采集方便,系统设备成本低;利用电话网络还可实现远程客户服

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值