- 博客(1)
- 收藏
- 关注
原创 AudioSet数据集介绍(含国内镜像地址)
AudioSet是Google发行的声音版ImageNet。AudioSet提供了两种格式:csv文件,包括音频所在的YouTube视频的ID,开始时间,结束时间 以及标签(可能是多标签)128维的特征,采样率为1Hz,也就是把音频按秒提取为128维特征。特征是使用VGGish模型来提取的,VGGish下载地址为 TensorFlow models GitHub repository,可以使用该模...
2018-06-24 19:01:50
14997
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人