【PYTHON】在Python中立体声到单声道wav

转载已于 2022-03-30 10:59:24 修改 · 1.6k 阅读

2 ·

CC 4.0 BY-SA版权

原文链接：https://www.796t.com/post/MmE4ZDI=.html

文章标签：

#python #音频

于 2022-03-23 22:08:12 首次发布

Python-声音处理专栏收录该内容

2 篇文章

订阅专栏

本文讨论了在将立体声音频转换为单声道时遇到的问题。错误的方法是通过平均左右声道的样本值来创建新的单声道数组，导致声音质量下降。解决方法在于将原始数据转换为浮点格式，并使用向量化操作（如numpy的切片或sum函数）来平均声道，从而提高效率并避免声音失真。

使用wavefile.read（）载入一个wav，它提供了samplerate和audiodata

这个音讯资料如果是立体声则储存为多维阵列，比如

audiodata[[left right]
          [left right]
          ...
          [left right]]

错误方法

用这个方法建立一个新的单声道音讯资料阵列，方法是（右+左）/2

def stereoToMono(audiodata)
    newaudiodata = []

    for i in range(len(audiodata)):
        d = (audiodata[i][0] + audiodata[i][1])/2
        newaudiodata.append(d)

    return np.array(newaudiodata, dtype='int16')

然后用

wavfile.write(newfilename, sr, newaudiodata)

这产生了一个单声道的wav档案，但是声音很脏，而且一直在点选等。做错什么了？

解决办法

首先，什么是audiodata的资料型别？假设它是某种固定宽度的整数格式，因此会溢位。

如果在处理前将其转换为浮点格式，则可以正常工作：

audiodata = audiodata.astype(float)

第二，不要一个元素一个元素地编写您的python程式码；向量化它：

d = (audiodata[:,0] + audiodata[:,1]) / 2

或者更好

d = audiodata.sum(axis=1) / 2

这将大大快于您编写的元素回圈。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

鱼儿潜水呢

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

MP3双声道转单声道的Python源码实现

CodeHeroicX的博客

09-12

294

在音频处理中，有时需要将MP3文件的双声道音频转换为单声道音频。本文将为你提供一个使用Python编写的源码示例，用于实现这一功能。这个方法需要传入一个整数参数，表示希望转换后的音频有多少个声道。在这里，我们将其设置为1，即单声道。完成这些步骤后，运行代码就会将双声道的MP3文件转换为单声道，并保存为指定的输出文件。的函数，它接受输入文件路径和输出文件路径作为参数。首先，我们需要安装所需的Python库。方法将转换后的音频保存为MP3文件。参数替换为你实际的输入文件路径。参数替换为你实际的输出文件路径。

Python音频处理：如何将立体声转换为单声道并调整采样率

最新发布

engchina的专栏

12-15

1051

Python音频处理：如何将立体声转换为单声道并调整采样率

参与评论您还未登录，请先登录后发表或查看评论

python音频处理（一）：双声道转成单声道，降采样

yolanda的数据分析进阶记录

10-10

3614

实现方法：利用ffmpeg自带的命令来完成首先要确保ffmpeg的/bin放到了环境变量中，在cmd里输入ffmpeg可测试是否能用接着便是在python里 import subprocess 这可以帮助我们在python里面调用ffmpeg的命令 ffmpeg的命令有很多，这里也是我自己挑了部分的参数，可自行百度 subprocess.call（）也有许多参数，不同参数功能不同，根据...

语音处理：Python实现Wav序列的声道拆分与合并

来知晓的博客

10-18

1943

项目中有时需要将多声道拆分成单声道，再将单声道进行分别处理，然后再合并为多声道。为提升批量处理音频序列的效率，写了以下脚本供参考。

使用Python处理声音文件（五）：绘制立体声音乐左右声道频谱

董付国的Python专栏

02-17

600

说明：1、需要首先安装Python扩展库scipy。2、本文代码只适用于未压缩的WAV声音文件。参考代码：绘制结果：----------相关阅读----------1900页Python系...

python wav模块获取采样率采样点声道量化位数(实例代码)

09-18

- 示例代码中的 `Channels` 值为 `1`，表示这是一个单声道音频文件。 4. **采样点数（Number of Frames）**： - 定义：音频文件总的样本点数量。 - 示例代码中的 `frames` 值为 `171698592`，表示音频文件总共有...

python 进行音频处理，单声道变双声道，提升音量

xuxiake的博客世界

10-09

5146

准备条件，安装ffmpeg ffmpeg官网 1 2 将下载下来的zip解压，添加环境变量使用AudioSegment进行格式转换为wav 使用wave进行单声道转换为双声道使用AudioSegment进行格式转换并提高音量 import wave from pydub import AudioSegment import os import numpy as np import str...

python单声道wav文件

10-12

在Python中，单声道WAV文件是一种常见的音频文件格式，它只包含一个声道，即声音的一个通道，适合用于音乐、语音等非立体声应用。在处理这类文件时，可以使用一些音频处理库，如wave、pydub或soundfile等。 `wave`...

Python对wav文件的重采样实例

09-17

在Python中，我们可以使用`wave`库来读取和写入wav文件。 2. **重采样原理**：重采样是根据特定的输出采样率，重新计算音频信号的样本值。这通常通过插值或降采样实现。`audioop.ratecv()`函数是Python的音频操作...

python生成一个单声道wav文件

10-12

在Python中，我们可以使用`wave`模块来创建单声道的WAV音频文件。`wave`是标准库的一部分，用于处理基本的WAV格式。下面是一个简单的示例，展示如何创建一个440赫兹的正弦波： ```python import wave import struct...

python+torchaudio加载音频数据源

12-23

用idea写的通过torchaudio,soundfile加载wav音频文件并展示音频信号图

python视频转换为音频/音频格式修改

weixin_52938961的博客

04-16

904

python视频转换为音频/音频格式修改

python 数组转音频_Python3+将2声道音频，分拆成1声道

weixin_39788131的博客

12-05

597

现在是将双声道的音频分拆成单声道的。同理可以将多声道的音频文件，转为1声道的音频文件。注意新形成的音频文件的rate，需要与原音频的相同。import osimport waveimport numpy as npimport pyaudiofile1 = os.path.join(os.path.abspath(os.path.dirname(os.path.dirname(__file__))...

Python双通道音频旋转

ALeX_Hu227的博客

06-04

1302

Python双通道音频旋转之前没有接触过音频数据扩充，于是在网上找了下，发现很多内容都是一样，然后上面的代码运行后发现我扩充的音频数据全都变成了单通道，而我的原始数据是双通道的。于是我找了下原因，发现是音频数据读取的时候方法问题。网上的代码` import librosa import numpy as np from scipy.io import wavfile y, sr = libro...

语音处理：Python实现音频文件声道分离批量处理

来知晓的博客

12-31

6940

在语音处理任务中，有时需要对立体声或多声道音频文件，批量处理成单声道文件，然后送入算法模型进行处理。这里，提供一个Python脚本实现批量分离，提高处理效率。

Python——语音处理基础

weixin_40620310的博客

09-03

1610

Python——语音处理基础目标： Python对音频文件的IO处理；语音中关于音量和音响的一些计算；一、概述声音物理意义：声音是一种纵波，纵波是质点的振动方向与传播方向同轴的波。如敲锣时，锣的振动方向与波的传播方向就是一致的，所以声波是纵波。纵波是波动的一种（波动分为横波和纵波）；通常对声音进行采样量化后，得到声音的"时间—振幅"信息；下图是用Adobe Audition打开一段音频数据：说明：图中上半部分为波形图，下半部分为频谱图；频谱通过对波形的傅里叶变换，把波形中的每个频率拆开

Python生成432Hz音频

captain

08-19

688

【代码】Python生成432Hz音频。

Python音频通道分离实战

qq_37934722的博客

05-03

1050

总结一下，通过pydub库的split_to_mono()函数，我们可以方便地将双声道转变为单声道，并保存分离后的左右声道文件。这个方法对于处理音频中的左右声道信息非常有用，有了它，我们就可以更加灵活地对音频进行处理和观察，比如可以通过比较左右声道的分布来检测录音设备是否有故障等等。首先，我们需要导入pydub库，接着读取音频文件，然后使用split_to_mono()函数将双声道转变为单声道，接着通过export()函数保存分离后的音频文件即可。无论是听歌、看电影，都需要用到音频。

【基于pyAudioKits的Python音频信号处理（三）】乐音和噪音

weixin_43441742的博客

08-01

1977

音频信号分为乐音与噪音两种类别。其中，发音物体有规律地振动而产生的具有固定音高的音称乐音，而噪音则是发音物体随机振动产生的没有固定音高的声音。本节将;l利用pyAudioKits API模拟生成乐音和噪音，分别讨论两种类型的音频信号及各自的性质，并讨论它们之间的联系。......