Sound Classification with TensorFlow总结

最新推荐文章于 2025-05-20 17:09:55 发布

zeroQiaoba

最新推荐文章于 2025-05-20 17:09:55 发布

阅读量4.1k

点赞数

CC 4.0 BY-SA版权

分类专栏：论文阅读总结

本文链接：https://blog.youkuaiyun.com/zeroQiaoba/article/details/78821017

audioSet 是2017年发布的音频事件数据集。
sound Classification借用了tensorflow中的音频处理模块，利用原始语音信号，提取原始特征->embedding features->利用youtube-8m中的模型，对audioSet中527个样本做分类。因此，这篇博客讲解的还是如何对audioSet数据集做分类。

注意：tensorflow官网同样给出了音频处理模块，只是给audio数据，得到embedding后的128维度特征，该特征经过了pca以及量化的处理，但是没有给出分类的操作。

python引用路径

name，绝对路径，指的是从python xx.py路径中xx的路径
. 相对路径，值得从这个文件开始的路径
from audio import

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

zeroQiaoba

关注关注

0
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

深度学习系列资料总结

专注大数据与人工智能技术分享，欢迎私信加群互相学习！

07-17

2万+

说明本系列深度学习资料集合包含机器学习、深度学习等各系列教程，主要以计算机视觉资料为主，包括图像识别、分类、检测、分割等，内容参考Github及网络资源，仅供个人学习。深度学习定义一般是指通过训练多层网络结构对未知数据进行分类或回归深度学习分类有监督学习方法——深度前馈网络、卷积神经网络、循环神经网络等；无监督学习方法——深度信念网、深度玻尔兹曼机，深度自编码器等。手写机器学习笔记github机器学习算法公式推导以及numpy实现github人工智能相关术语link。..................

Tensorflow学习总结

MARY197011111的博客

03-30

684

一、tensorflow简介 1.TensorFlow是Google开发的一款神经网络的Python外部的结构包, 也是一个采用数据流图来进行数值计算的开源软件库. 2.安装:利用anaconda安装 3.原理：通过不断学习进行曲线拟合，由图1到图2。TensorFlow是采用数据流图来计算, 所以首先我们得创建一个数据流流图, 然后再将我们的数据（数据以张量(tensor)的形式存在）放在...

参与评论您还未登录，请先登录后发表或查看评论

Sound-Classification:城市声音分类

04-13

声音分类城市声音分类。所有代码均基于，所有功劳归于mikesmales

tensorflow总结

qq_32110859的博客

09-13

325

最近的工作主要围绕tensorflow分布式（ps-worker，horovod）的改造，连最基本的模型搭建以及损失函数等都忘记了。出了问题都不知道该从何查起，做如下总结。一、目前遇到的问题： imagenet 数据集训练alexnet模型，模型loss输出一直固定在6.9左右。已经查过以下问题。模型的参数随着训练过程在变化将模型输入设置为全白图片，检查模型输出l...

UrbanSound8k数据集资源介绍：面向声音分类的全面数据支持

最新发布

gitblog_06725的博客

05-20

702

UrbanSound8k数据集资源介绍：面向声音分类的全面数据支持【下载地址】UrbanSound8k数据集资源介绍 UrbanSound8k数据集是一个专注于环境声音分类的资源，包含10种常见的生活场景声音，如冷气机、汽车喇叭、狗吠声等，每个录音约4秒。数据集分为10个fold文件夹，便于交叉验证和模型训练。它为声音...

Tensorflow总结

lynn_001的博客

01-02

222

1、查看device信息 import os import tensorflow as tf # os.environ['TF_CPP_MIN_LOG_LEVEL'] = '3' a = tf.constant([1., 2., 3.], shape=[3], name='a') b = tf.constant([1., 2., 3.], shape=[3], name='b') c = a...

Tensorflow 总结

joe_8086的博客

09-20

486

TF中还有一个概念是kernel，kernel是operation在某种设备上的具体实现。TF的库通过注册机制来定义op和kernel，所以可以通过链接一个其他的库来进行kernel和op的扩展。

TensorFlow总结（2020版）

YBAdiam的博客

09-13

474

前言 TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统，其命名来源于本身的运行原理。Tensor(张量)意味着N维数组，Flow(流)意味着基于数据流图的计算，TensorFlow为张量从流图的一端流动到另一端计算过程。TensorFlow是将复杂的数据结构传输至人工智能神经网中进行分析和处理过程的系统。 TensorFlow可被用于语音识别或图像识别等多项机器深度学习领域，对2011年开发的深度学习基础架构DistBelief进行了各方面的改进...

城市声音分类 Urban Sound Classification with TensorFlow Keras - .zip

04-25

这里为你收集整理了关于AI，机器学习，深度学习相关的资料一份，质量非常高，如果你投入时间去研究几天相信肯定对你有很大的帮助。到时候你会回来感谢我的。本资源是经过本地编译测试、可打开、可运行的文件或源码...

Urban-Sound-Classification-VS-master_城市声音分类_城市声音_UrbanSound_Urba

09-11

在这个项目"Urban-Sound-Classification-VS-master"中，我们看到的是一个使用Visual Studio 2017开发的城市环境声音识别系统。这个系统的目标是训练模型来区分不同类型的都市噪声，如交通噪音、人声、动物叫声等，...

用 Keras 建立CNN对 UrbanSound 进行音频分类

JOHZEN

07-08

7961

Urban Sound Classifier using CNN v2 第一个CNN的分类器效果惨烈，有许多细节都没有注意到，感觉修改也令人心烦，从头开始。老实说我也不知道这次能不能成功，边做边看吧。上次踩过的坑和经验之前把频谱当作训练数据输入，但频谱里的数值都是负数，后来换为了绝对值。但这样其实也不行，应该要进行normalization。把是把值的范围限制在[-1,1]还是[0...

用Tensorflow进行简单音频分类

学姐带你玩AI的博客

06-24

1784

Tensorflow因支持功能的全面性，序列化的突出优点，以及高性能的部署优点等等俘获了一大批的铁杆粉丝。但是对于小白来说要上手还是需要啃一些实战案例，积累一些实现方法的。在视觉、语言领域相关的深度学习发展很好，例如：CNN 在图像上表现非常好，具有像素的局部相关性；RNN 或transformers这样的序列模型在语言上也表现得非常好，具有顺序性。音频看起来用的很少，以至于一些同学也不知道处理音频数据时使用了哪些类型的模型和过程。来啃下面的Tensorflow 代码吧！你会收获到音频分类问题的.

tensorflow总结帖

zeroQiaoba的博客

04-24

587

变量定义：#随机产生100个数，类型为float32 x_data = np.random.rand(100).astype(np.float32) y_data = x_data*0.1 + 0.3x_data = np.linspace(-1,1,300)[:, np.newaxis] noise = np.random.normal(0, 0.05, x_data.shape) y_data

TensorFlow基础知识点总结(常用知识点)

石头的博客

01-03

529

TensorFlow基础知识点总结(常用知识点)

tensorflow问题总结

m0_37712157的博客

02-12

3272

目录 1、tensorflow python framework erros invalidArgmentError:connot batch tensors with different shapes in componet 0. First element had shape [227,227,3] and element 19 had shape [227,227,4] 2、incomp...

tensorflow的用法总结

fangju2013的博客

08-14

608

tensorflow的用法总结：1. Tensor的用法：tensor是张量，一般可以认为tensor就是指的矩阵，例如： import tensorflow as tf a = tf.zeros(shape=[1,5]) 表示一个1*5的矩阵，且是一种数据的抽象概念，没有实际赋值，也没有分配空间。2. Variable的用法：variable是变量的意思，一般用来表示各种计算参数，包括矩阵、

tensorflow学习总结（一）

weixin_45187794的博客

07-24

272

学了了tensorflow 中关于函数以及Variable函数的使用，以下是相关代码以及注释。 import tensorflow as tf state=tf.Variable(0,name='variable1')#给定变量的初始值以及名字 print(state.name)#打印变量名 con=tf.constant(1,name='constant1')#常量值为1 new_value=tf.add(state,con) newstate=tf.assign(state,new_value)#ass

Tensorflow学习总结一

qiang0556的博客

08-11

1040

Tensorflow学习总结记录学习Tensorflow的所有内容，学习资料来源于Tensorflow官网。 1 张量的阶、形状、数据类型 1.1 阶在TensorFlow系统中，张量的维数来被描述为阶.但是张量的阶和矩阵的阶并不是同一个概念.张量的阶（有时是关于如顺序或度数或者是n维）是张量维数的一个数量描述.比如，下面的张量（使用Python中list定义的）就是2阶. ...

TensorFlow常用总结

一只小包子的博客

09-15

685

文章目录1.计算图节点与Tensor 1.计算图节点与Tensor TensorFlow计算图中每一个节点都定义了一个计算，而计算的结果都通过Tensor 来保存，因此Tensor和计算图中节点对应的计算结果所对应，同时Tensor具有3个重要属性，name，dtype，shape，通过name可以唯一确定计算图上的一个Tensor，而Tensor通过dtype和shape相当于确定了一个sche...

TensorFlow Estimator框架文本分类实战教程

- text-classification：文本分类，指将文本数据划分到特定类别的过程。 - tensorflow：Google开源的深度学习框架，广泛用于机器学习和深度学习领域。 - estimator：TensorFlow中的高级API组件，用于简化机器学习...