这篇文章的目的只是将工作里面的一些想法写下来,以供以后研究方向。
人的声音我们可以辨别,无论是经过了电子记录还是现实。那么为什么声音复杂的环境下我们不能分辨了。我在想能不能提取某人的音色,或者音的某种东西,以此为依据,将一个混音的数据里面,以那个人的音为模型,进行重构,后续待续。
本文探讨了在复杂声音环境下如何实现特定人声的精准提取与分离。通过分析个人音色特征,提出了一种可能的方法来从混合音频中重构指定个体的声音。
这篇文章的目的只是将工作里面的一些想法写下来,以供以后研究方向。
人的声音我们可以辨别,无论是经过了电子记录还是现实。那么为什么声音复杂的环境下我们不能分辨了。我在想能不能提取某人的音色,或者音的某种东西,以此为依据,将一个混音的数据里面,以那个人的音为模型,进行重构,后续待续。
7692

被折叠的 条评论
为什么被折叠?