反复看了deep speaker这篇论文之后,还是不太能理解论文中的embedding是什么意思?就查看了一些博客
embedding表示的是一个mapping,是指将说话人的特征映射在一个超维空间中,特定说话人A的语音特征X只能被说话人A的语音特征Y所对应。
这只是我初步见拙见,若有误还请不吝指出。
参考链接:https://www.zhihu.com/question/32275069
https://blog.youkuaiyun.com/liuweiyuxiang/article/details/83013323