音频
潘旭阳
秉承一颗改变人们生活方式、推动地球进步的心志,畅游在AI知识的广袤海洋, 就算你是一只洁白无瑕的小白,坚持下去,总有一天,你也能够登上属于自己的AI舞台。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python音频重采样实现
两种方法实现方法1: 借助librosa音频库方法2: 借助ffmpeg-python库方法1 代码如下import librosanum = 2audio, sr = librosa.load(f'/source/d3/ContentGeneration/root/head/{num}/audio.wav', sr=None)print(type(audio), audio.dtype)print(f'sr: {sr}')audio_24k = librosa.resample(au原创 2021-03-16 16:07:25 · 2358 阅读 · 1 评论 -
wave读音频librosa处理音频wave写音频
背景librosa读音频,librosa处理音频,librosa写音频,比较简单。项目是wave模块读取音频,wave模块写入音频,但是wave模块处理音频数据方法太少,必须调用librosa模块实现音频处理,这个流程是:音频文件—>wave读取—>得到字节码—>解码为整形数据—>librosa处理—>编码为字节码—>写入音频文件代码如下 src = '1.wav' wave_read = wave.open(src, 'rb') len原创 2021-03-16 16:03:27 · 2011 阅读 · 0 评论 -
音频属性采样率、通道数、位数、比特率、帧等
【音频】指人耳可以听到的声音频率在20HZ~20kHz之间的声波,称为音频。【采样频率】来源:音频采样,是把声音从模拟信号转换为数字信号。定义:采样率,就是每秒对声音进行采集的次数,同样也是所得的数字信号的每秒样本数。常用的采样率有:8,000 Hz - 电话所用采样率, 对于人的说话已经足够11,025 Hz - AM调幅广播所用采样率22,050 Hz和24,000 Hz - FM调频广播所用采样率32,000 Hz - miniDV 数码视频 camcorder、DAT (LP mo原创 2020-12-23 21:40:35 · 11596 阅读 · 1 评论 -
使用librosa对音频进行加载拼接截取叠加等操作
注意:librosa只能读取wav格式音频文件代码如下import numpy as npimport librosa# 1.加载音频文件audio_path1 = './audio1.wav'y1, sr1 = librosa.load(audio_path1)dur1 = librosa.get_duration(y1, sr=sr1)print('数据x类型和采样率sr类型', type(y1), type(sr1))print('数据x尺寸和采样率', y1.shape, sr1原创 2020-12-10 18:00:07 · 4965 阅读 · 0 评论 -
python音频处理库librosa基本操作
基本操作使用librosa读取音频、可视化音频、绘制音频的声谱图代码如下import librosaimport matplotlib.pyplot as pltimport librosa.display# 1.加载音频文件audio_path = '/audio1.wav'x, sr = librosa.load(audio_path)print('数据x类型和采样率sr类型', type(x), type(sr))print('数据x尺寸和采样率', x.shape, sr)原创 2020-12-08 18:05:02 · 5083 阅读 · 7 评论
分享