sox和ffmpeg 处理语音工具

本文介绍了使用Sox和FFmpeg进行音频处理的方法。包括用Sox截取长语音片段、拼接短语音、将pcm转wav、查看wav信息、降采样、做增益、合并单通道数据为双通道数据,还介绍了用FFmpeg生成固定长度的空音频。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.截取长语音中的片段
sox input.wav output.wav trim start-time(s) duration(s)
例:将a.wav 截取0.1s至1.3s语音片段保存下来
sox a.wav b.wav trim 0.1 1.2

2.将多个短语音拼接成长语音
sox a.wav b.wav c.wav … -t wav -e signed-integer -b 16 -r 16000 - |
例:将a.wav与b.wav拼接成长语音c.wav
sox a.wav b.wav -t wav -e -signed-integer -b 16 -r 16000 c.wav

3.将pcm转wav
sox -t raw -c 1 -e signed-integer -b 16 -r 16000 input.pcm output.wav

4.查看wav的信息 sox 和soxi的区别
sox a.wav -n stat 输出的信息属于标准错误输出(stderr)类型打印在屏幕上
soxi a.wav 输出的信息属于标准输出(stdout)类型打印在屏幕上

5.sox将16k降采样到8k
sox -r 16000 input.wav -t 8000 output.wav

6.sox做增益 -v
sox -v 0.5 input.wav output.wav
将input.wav音量放大0.5倍后写入到output.wav

7.sox合并两条单通道数据为一条双通道数据 -M
sox a.wav b.wav -M stereo.wav

8.生成一条固定长度的空音频(silence)
ffmpeg -f lavfi -t 3 -i anullsrc=r=16000:cl=mono a.wav

ffmpeg -f lavfi -t 时长(s) -i anullsrc file.wav

默认的是44k双通道,需要指定采样率和通道数增加anullsrc=r=16000:cl=mono

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值