- 博客(2)
- 收藏
- 关注
原创 简单的语音数据集制作方案
最后强调一下,如果你的数据集本身也就是几分类,效果还是非常差(类似四五分类,但是准确率也就70以下),请先质疑自己数据的问题,而不是质疑模型的问题。并且,我的数据集文件音频格式也就是2s一个的,如果自定义数据长度请更改pad_3d的seglen参数,至于为什么pad_3d这个东西这么抽象,用numpy的方式处理tensor数据之后再改回来?注:文件的存储方式如图所示,里面每个0-4文件夹下都是wav格式的文件,更复杂的数据存储结构请另请高明,如果你的数据后缀是ogg之类的请更改代码。
2023-03-25 10:04:21
1398
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人