PCM音频流转WAV

记一次前端语音合成遇到的坑:PCM音频流转WAV

与后端使用webSocket连接,将一段文字合成语音,流程是输入一段文字通过webSoket连接发送给后端,后端是将pcm的音频流以base64编码的形式一段一段返回给我的,所以我需要将base64编码累加一起变成一段完整的base64编码的pcm音频流,之后转二进制,然后再转wav格式的音频流去播放,但是这些我都不会转啊,之前也没做过,后端真是省事,让他转好给我还说不能转,cao了dan了,然后就找资料,功夫不负有心人,找到个大神用js来转的。

  • 问题
    再拿到了后端给的base64的音频流,将音频流用base64解码转成byte[]数组后转为wav格式的音频流。

  • 解决办法(直接附代码,也是参考大神的)

  1. 创建PCM2WAV类
const stream = require('stream')
const waveheader = require('waveheader') // 这里要是显示没有这个包, 直接npm install waveheader --save

class PCM2WAV {
  constructor (options) {
    let pcm2wav = new stream.Transform()
    options = options || {}
    options.size = options.size || 0
    options.channels = options.channels || 1
    options.sampleRate = options.sampleRate || 16000 // 这里修改采样率合成的语音可以调整说话的快慢,我也是试验了几次才知道 ,采样率,支持 11025、16000、22050、24000、44100、48000,11025我觉的还是快,我设置了8000 感觉正好(这是我的情况,可以问算法会告诉你这个语音的采样率多少合适)

    pcm2wav._transform = function (chuck, encoding, done) {
      if (!this._initialized) {
        this.push(waveheader(options.size, {
          channels: options.channels,
          sampleRate: options.sampleRate
        }))
        this._initialized = true
      }
      this.push(chuck)
      done()
    }
    return pcm2wav
  }
}

export {
  PCM2WAV
}
  1. 处理base64格式的pcm数据
let bstr = atob(pcmdata)
let n = bstr.length
let u8arr = new Uint8Array(n)
while (n--) {
   u8arr[n] = bstr.charCodeAt(n)
}
  1. pcm转为wav格式音频数据,并测试播放wav音频
let pcm2wav = new PCM2WAV()
pcm2wav.write(u8arr, () => {
    let data = pcm2wav.read()
    let blob = new Blob([data], {type: 'audio/wav'})
    let audio = new Audio()
    audio.src = URL.createObjectURL(blob)
    audio.oncanplay = () => {
        audio.play()
    }
})

在这里插入图片描述

1、Java实现wav音频文件转换为pcm音频文件(AudioUtils.java) 2、Java实现播放pcm音频文件(PCMPlay.java) WAVwav是一种无损的音频文件格式,WAV符合 PIFF(Resource Interchange File Format)规范。所有的WAV都有一个文件头,这个文件头音频流的编码参数。WAV音频流的编码没有硬性规定,除了PCM之外,还有几乎所有支持ACM规范的编码都可以为WAV音频流进行编码。 PCM:PCM(Pulse Code Modulation----脉码调制录音)。所谓PCM录音就是将声音等模拟信号变成符号化的脉冲列,再予以记录。PCM信号是由[1]、[0]等符号构成的数字信号,而未经过任何编码和压缩处理。与模拟信号比,它不易受传送系统的杂波及失真的影响。动态范围宽,可得到音质相当好的影响效果。 简单来说:wav是一种无损的音频文件格式,pcm是没有压缩的编码方式。 WAVPCM的关系 WAV可以使用多种音频编码来压缩其音频流,不过我们常见的都是音频流被PCM编码处理的WAV,但这不表示WAV只能使用PCM编码,MP3编码同样也可以运用在WAV中,和AVI一样,只要安装好了相应的Decode,就可以欣赏这些WAV了。在Windows平台下,基于PCM编码的WAV是被支持得最好的音频格式,所有音频软件都能完美支持,由于本身可以达到较高的音质的要求,因此,WAV也是音乐编辑创作的首选格式,适合保存音乐素材。因此,基于PCM编码的WAV被作为了一种中介的格式,常常使用在其他编码的相互转换之中,例如MP3转换成WMA。 简单来说:pcm是无损wav文件中音频数据的一种编码方式,但wav还可以用其它方式编码。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值