反复看了deep speaker这篇论文之后,还是不太能理解论文中的embedding是什么意思?就查看了一些博客
embedding表示的是一个mapping,是指将说话人的特征映射在一个超维空间中,特定说话人A的语音特征X只能被说话人A的语音特征Y所对应。
这只是我初步见拙见,若有误还请不吝指出。
参考链接:https://www.zhihu.com/question/32275069
https://blog.youkuaiyun.com/liuweiyuxiang/article/details/83013323
本文深入探讨了Deepspeaker论文中的关键概念——embedding。embedding是一种映射方式,它将说话人的特征转换到高维空间中,确保每个说话人的语音特征在该空间中具有唯一性。这一过程对于语音识别和说话人验证至关重要。
1万+

被折叠的 条评论
为什么被折叠?



