audioSet 是2017年发布的音频事件数据集。
sound Classification借用了tensorflow中的音频处理模块,利用原始语音信号,提取原始特征->embedding features->利用youtube-8m中的模型,对audioSet中527个样本做分类。因此,这篇博客讲解的还是如何对audioSet数据集做分类。
注意:tensorflow官网同样给出了音频处理模块,只是给audio数据,得到embedding后的128维度特征,该特征经过了pca以及量化的处理,但是没有给出分类的操作。
- python引用路径
name,绝对路径,指的是从python xx.py路径中xx的路径
. 相对路径,值得从这个文件开始的路径
from audio import