
AI歌手实践--陈奕迅
看到b站上很火的AI孙燕姿,感觉很有意思。一直很喜欢eason的歌,在网上找了教程,实践一下。
谭欣tanxin
这个作者很懒,什么都没留下…
展开
-
音频文件分割并且去除掉人声过少音频
考虑到去除背景音乐之后一般歌曲的头尾人声都比较少,甚至是完全没有声音的。且训练模型时,音频文件长度应该在10-20s左右,音频文件太大会导致显存压力太大。因此,遍历所有文件夹,判断文件名是否为vocals.wav,并将其复制到另一个文件夹中,将该音频文件重命名为其所在的文件夹名加上vocals.wav。使用spleeter分割后的人声与背景音乐分别存储在很多文件夹中。有许多这样的文件夹存储分离的人声与背景音乐。其中人声的音频文件名为。因此,需要在此对音频文件进行分割并且删除人声较少的部分。原创 2024-10-17 15:52:17 · 241 阅读 · 0 评论 -
AI歌手训练预处理--音频文件人声分离
模型的训练需要大量的音频。鉴于国语与粤语的区别,因此我只选择了其中44首国语歌曲,尝试训练一下国语版的eason。这里需要用到一个github上开源的工具--slpeeter。通过这个工具,可以直接去分离人声与背景音乐,非常方便。另外,分离背景音乐与人声需要用到该工具下的双声道模型。将压缩包解压后将其中的模型复制到SpleeterGUI文件夹中的pretrained_models文件夹中(见上图)。下载好歌曲之后,需要去除背景音乐,得到纯净的人声。这个工具有gui版的,下载之后直接打开。原创 2024-10-16 22:03:16 · 476 阅读 · 0 评论