soundfile & torchaudio 读取音频文件

半截木头渡海洋

已于 2023-07-16 04:28:00 修改

阅读量1.7k

点赞数

分类专栏： pytorch 机器学习文章标签：音频文件 torchaudio soundfile

于 2023-07-16 03:48:57 首次发布

本文链接：https://blog.youkuaiyun.com/ljl86400/article/details/131746548

版权

机器学习同时被 2 个专栏收录

9 篇文章

订阅专栏

pytorch

4 篇文章

订阅专栏

文章讨论了soundfile和torchaudio两个库在读取音频文件后数据格式的差异。soundfile读取的结果是numpy数组，一维结构，而torchaudio则返回二维张量，适用于PyTorch环境。当需要在两者间转换时，需要进行格式转换操作。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

soundfile 和 torchaudio 读取音频文件后的数据格式不同，前者是numpy，后者是tensor。前者读取后可以直接用于一些python的基础函数输入，后者用于pytorch的一些函数的应用。两者互换用途时候需要进行格式转换。

import soundfile as sf
import torchaudio
sound_file_3, sr = sf.read('./audio/bed_room_record_3.wav')
torch_audio_3, sr = torchaudio.load('./audio/bed_room_record_3.wav')

soundfile 读取音频文件后，数据格式为numpy.array ，数据是1维的，大小定义为 [ samples]

torchaudio 读取音频文件后，数据格式为 tensor ，数据是2维的，大小定义为 [ch , samples]

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

半截木头渡海洋

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

深入探索 `soundfile` 与 `torchaudio`：音频处理利器

笔者从事电信媒体开发多年，愿意将多年的开发经验分享给同行

10-28

1701

本文详细介绍了soundfile和torchaudio这两个强大的音频处理库，并通过代码示例展示了如何使用它们来读取音频文件，并对文件进行转码，统一转换为 PCM 16kHz 16BIT 格式。soundfile基于 libsndfile，支持多种音频格式，提供了简洁的接口来读取和写入音频文件。而torchaudio则是 PyTorch 的一个音频处理库，提供了丰富的音频处理功能，并与 PyTorch 深度集成，便于在深度学习模型中使用。在实际应用中，我们可以根据具体需求选择使用soundfile或。

Jetson 系列（十八） soundfile

_yuki_

06-21

534

问题： install for cffi ... error 解决方式：一、必须的组件 sudo apt-get install libsndfile1 sudo apt-get install libffi-dev 二、安装 pip3 install soundfile

1 条评论您还未登录，请先登录后发表或查看评论

Python-SoundFile 使用教程

gitblog_00445的博客

08-09

2215

Python-SoundFile 使用教程 python-soundfileSoundFile is an audio library based on libsndfile, CFFI, and NumPy项目地址:https://gitcode.com/gh_mirrors/py/python-soundfile 项目介绍 Python-SoundFile 是一个基于 libsndfile、...

python-soundfile:SoundFile是基于libsndfile，CFFI和NumPy的音频库

05-28

python-soundfile 模块是基于libsndfile，CFFI和NumPy的音频库。完整文档可在。 soundfile模块可以读取和写入声音文件。是一个免费的，跨平台的开源（LGPL）库，用于读取和写入运行在许多平台（包括Windows，OS X和Unix）上的许多不同的采样声音文件格式，它通过支持文件读取/写入。它可以通过访问，是Python调用C代码的外部函数接口。 CPython 2.6 +，3.x和PyPy 2.0+支持CFFI。 soundfile模块将音频数据表示为NumPy数组。 python-soundfile已获得BSD许可（BSD 3-条款许可）。（c）2013年，巴斯蒂安·贝希特（Bastian Bechtold）重大变化 soundfile模块在最近的几个发行版中发展Swift。最值得注意的是，我们从改变了进口名import

soundfile

zz_hh_uu_的博客

01-31

3147

wget “http://www.mega-nerd.com/libsndfile/files/libsndfile-1.0.28.tar.gz” ./configure make &amp;&amp; make install python示例: import soundfile def readsoundfile(wavpath): audio_data, samplerate =...

SoundFile

AI工程化、开源分享、文档翻译、代码笔记

07-27

803

一、关于 SoundFile 突破性的变化安装二、Building 三、错误报告四、读/写函数五、块处理六、`SoundFile`对象七、原始文件八、虚拟 IO 内存文件九、已知问题

《探索 Python 音频处理利器：soundfile》：此文为AI自动生成

zheng_ruiguo的专栏

10-15

1764

Soundfile 是一个功能强大、跨平台的 Python 音频库，为音频处理提供了简洁高效的解决方案。

声学、音乐计算常用工具总结（soundfile、librosa、pydub、madmom、spleeter）

Brikie的博客

07-29

7098

文章目录前言一、soundfile二、librosa1.引入库2.读入数据总结前言学习必须要经常总结，通过总结梳理才能记得牢，另外也方便以后用到的时候回头查阅，这也是我写优快云的主要目的。如果同时能够对网友查阅资料起到一点点帮助，那就更好。我刚刚参加了音乐节拍检测的比赛，由于是初次接触计算音乐学这个领域，我学习了一些常用的工具，怕以后不用忘了，赶紧趁热总结一下。一、soundfile soundfile常用于音频文件读写： import soundfile as sf data, sampl.

python+torchaudio加载音频数据源

12-23

`soundfile`则更注重音频文件的读写操作，适合对音频进行编辑或处理后再保存。总之，结合`torchaudio`和`soundfile`，我们可以高效地处理音频数据，为后续的音频分析和机器学习任务打下坚实的基础。在实际应用中，...

【Python】音频读写和重采样(wave/librosa/soundfile/scipy/pydub/torchaudio)

好记性不如烂笔头

10-31

1817

音频读写和重采样方法

Python库 | SoundFile-0.8.1.tar.gz

03-10

python库。资源全名：SoundFile-0.8.1.tar.gz

python读取音频文件的几种方式

最新发布

03-17

如果只是需要读写音频文件，Soundfile更合适。还要注意API设计，Torchaudio和PyTorch集成更好，而Soundfile的API更接近numpy。最后，生成相关问题时要覆盖安装、功能对比、选择建议、性能优化和应用场景等方面，...

推荐开源项目：Python-Soundfile - 强大的音频处理库

gitblog_00046的博客

05-19

847

Python音频处理入门：SoundFile和Librosa库详解

engchina的专栏

12-15

714

Python音频处理入门：SoundFile和Librosa库详解

pytorch深度学习入门（5）之-Torchaudio音频加载

ajunbin859的专栏

11-10

7698

Torchaudio是一个用于处理音频数据的Python库，它是基于PyTorch的扩展库，提供了丰富的音频处理功能和一系列预处理方法，方便用户在音频领域进行机器学习和深度学习的研究。具体来说，Torchaudio提供了从音频文件的读取到加载，音频变换和增强，以及音频数据可视化的整套工具。此外，Torchaudio还集成了一些常见的音频数据集，方便用户快速获取和处理音频数据。在安装方面，首先需要安装PyTorch，可以通过pip install torch命令来安装最新版本。

python实现音频文件的批量拼接（soundfile+numpy）

qq_42838243的博客

07-27

3992

此段代码实现音频文件的批量拼接，调用了numpy和soundfile两个模块，具体拼接方式为：以一则通用音频为通用的拼接音频的前半部分，以指定文件夹背的所有音频为拼接音频的后半部分~

torchaudio - Python wave 读取音频数据对比

程永强

06-07

7040

torchaudio - Python wave 读取音频数据对比