语音文本格式转化及在librosa库的语音文本输入要求
闲话少说,直接上料!
python的librosa库是语音模型进行语音特征提取的常见的库;但使用时请注意,librosa库仅支持wav格式的语音文件!!!如果你上传的文件格式为m4a,则可通过ffmpeg对语音文件的格式进行转换,前提是安装ffmpeg!!!
对于常见的苹果手机/电脑录音,音频格式为m4a;如果我们把它转化为wav格式,进行如下操作
ffmpeg -i 需要转化的文件名.m4a 目标文件名.wav
其中,目标文件名自己定义,转化后的wav格式文件自动保存到当前路径下。
ref : 安装ffmpeg的步骤
如果对你的语音转化有帮助,请关注本人blog;接下来,我会分享更多的关于NLP,ASR相关的博文;如对相关领域感兴趣,欢迎留言讨论~