声纹技术（六）：声纹技术的其他应用

u013250861

已于 2024-02-14 12:52:32 修改

阅读量1k

点赞数

分类专栏： Audio 文章标签：声纹

于 2022-06-24 21:37:14 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/u013250861/article/details/125452619

版权

Audio 专栏收录该内容

60 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

6.1　声纹的力量

前面几章介绍的声纹识别与声纹分割聚类都属于声纹技术在音频信号处理中的最直接的应用。而除了这些直接应用，由于声纹本身包含着与说话人身份相关的信息，其在其他领域也能发挥出重要作用。

声纹信息在其他领域中发挥作用有很多种方式，其中一种比较经典的架构便是通过声纹嵌入码，将特定说话人的身份信息，作为该领域传统模型的辅助输入，融合到模型的训练过程中，如图6.1 所示。该架构中的辅助音频，来自该任务所对应的具体说话人。而基于从该辅助音频中提取的声纹嵌入码，能够让传统模型更精准地针对该说话人完成相应的任务。这里的声纹编码器可以采用第3 章介绍过的各种模型，不过现在一般都采用基于神经网络的声纹编码器。而架构中的输入与输出可以有很多种形式，既可以是音频，也可以是时频谱、文字、类别或其他信息，具体依应用而异。

图6.1　将声纹信息用于辅助其他领域模型的经典架构

6.2　用于语音识别

6.2.1　语音识别技术概述</

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。