小程序进行语音识别音频MP3转PCM

最新推荐文章于 2025-04-20 21:36:51 发布

kung900519

最新推荐文章于 2025-04-20 21:36:51 发布

阅读量2.6k

点赞数

分类专栏：微信支付宝开发

本文链接：https://blog.youkuaiyun.com/kung_com/article/details/106227847

版权

初步技术方案是：小程序录音-上传录音文件到后端服务器，后端服务器调用阿里云一句话语音识别接口获取识别结果并返回给小程序。

小程序的录音文件格式只能是MP3或者AAC，而阿里云语音接口所能接受的音频文件格式为PCM,WAV，最后决定在后端将接收的MP3文件转换成PCM文件。

错误1 could not get audio input stream from input stream

出现这个错误的原因是没有引入MP3解析库

<dependency>
    <groupId>com.googlecode.soundlibs</groupId>
    <artifactId>mp3spi</artifactId>
    <version>1.9.5-1</version>
</dependency>

引入过后，发现错误1解决了，出现了下面的错误2

错误2 java.lang.IllegalArgumentException: Unsupported conversion: PCM_SIGNED from MPEG1L3 44100.0 Hz, unknown bits per sample, stereo, unknown frame size, 38.28125 frames/second

网上找到有说是进行格式转换的源码有问题，有很多参数都没有设置，所有才会报这个错误

更改前的源码（错误源码）

  public byte[] mp3Convertpcm(InputStream mp3Stream) throws Exception {
        // 原MP3文件转AudioInputStream
        Aud

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

kung900519

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

小程序——MP3转pcm之殇

weixin_34296641的博客

02-20

983

一、需求背景明确需求：微信小程序实现语音识别。分析需求：目前我们科大讯飞平台目前已经支持语音识别相关业务，我们只要将小程序语音上传（对接）到科大讯飞语音处理后台，就能完成上述需求。问题拆解：上述需求 => 将小程序语音按照目前接口要求的格式上传到讯飞语音接口。二、分析和调研问题 小程序支...

微信小程序录音silk文件格式转换为MP3及PCM格式的方法

qq_42197800的博客

06-07

1万+

关于silk文件如何转码为MP3或PCM格式的方法介绍：最近在做微信小程序的人工客服，需要用到百度AI语音识别，但是因为微信的录音文件格式为 .silk，但是百度AI识别的格式应该为PCM或者WAV格式的文件，需要进行文件格式转换。经过一番查找和折腾，终于搞定了。特意发出来和大家分享下，具体方法如下。步骤一：下载格式转换工具 silk2mp3-full.rar，提取码：m22l，解压后按Re...

1 条评论您还未登录，请先登录后发表或查看评论

mp3文件转成pcm格式

10-22

Mp3转换PCM（VS2010）。可用，放心。

uniapp+微信小程序实现腾讯一句话语音识别

2401_89141279的博客

04-20

1253

本文将介绍如何通过 **uni-app** 和 **微信小程序** 的能力，结合腾讯云的语音识别（ASR）服务，实现一个完整的语音录制和识别功能。- [微信小程序云开发文档](https://developers.weixin.qq.com/miniprogram/dev/wxcloud/basis/getting-started.html)// 替换为你的 SecretKey。- [腾讯云语音识别官方文档](https://cloud.tencent.com/document/product/1093)

微信小程序把玩（三十四）Audio API

FUCK

09-28

1万+

没啥可值得太注意的地方重要属性：1. wx.getBackgroundAudioPlayerState(object) 获取播放状态2.wx.playBackgroundAudio(object)播放音乐3.wx.pauseBackgroundAudio()暂停音乐4.wx.seekBackgroundAudio(object) 设置播放进度5.wx.stopBackgroundAudio()停止播

微信小程序实现pcm音频转换wav音频

whiteplayer的博客

06-08

3730

总体思路就是，在拿到录音结束之后的临时录音文件路径的时候，创建一个文件管理器，然后读取录音文件拿到二进制数据，再调用工具函数进行转换，完成之后将转换完成的文件写入到新的文件中，拿到新文件的路径去上传到数据库。录音录制之后拿到tempFilePath const FileSystemManager = wx.getFileSystemManager() FileSystemManager.readFile({ filePath: filepath, success: res => { let

mp3转pcm

weixin_42599429的博客

06-18

828

安装ffmeg后 ffmpeg -y -i youxiyuyin0802002.mp3 -acodec pcm_s16le -f s16le -ac 2 -ar 16000 youxiyuyin0802002.pcm

微信小程序实现语音识别转文字功能及遇到的坑

10-16

在微信小程序中实现语音识别转文字功能，开发者需要面对一系列技术挑战和问题。本文将详细介绍这一过程中的关键步骤和常见陷阱。首先，开发者需要注意微信开发者工具与移动端的差异。在工具上，录音文件的路径是`...

微信小程序语音silk转换pcm，wav格式

09-05

微信小程序语音识别，转成一般各大接口所用的wav格式，有的语音接口可以使用pcm，不过听别人所建议转成wav的更好识别，这里面的是不需要安装操作的ffmpeg.exe和silk_v3_decoder.exe文件，所以应该都可以使用，比如...

微信小程序通过websocket实时语音识别的实现代码

11-19

在本文中，我们将探讨如何在微信小程序中实现通过WebSocket进行实时语音识别的功能。这个功能主要依赖于微信小程序的录音管理器（RecorderManager）以及百度的实时语音识别API。以下是实现这一功能的关键步骤和相关...

微信小程序录音silk文件格式转换为MP3及PCM格式的方法-附件资源

03-02

微信小程序录音silk文件格式转换为MP3及PCM格式的方法-附件资源

mp3文件转成pcm格式.rar

07-30

mp3文件转成pcm格式.rar,太多无法一一验证是否可用，程序如果跑不起来需要自调，部分代码功能进行参考学习。

mp3转pcm/wav.rar

05-19

本项目基于gradle管理工具，用jave实现了MP3格式的音频文件格式的转换（包括：pcm、wav格式）

将 MP3 转成 PCM 并使用 AudioTrack 播放

董攀的博客

10-25

1822

将 MP3 转成 PCM 并通过 UDP 发送

微信小程序录音怎么获取mp3格式的文件

最新发布

04-23

<think>好的，用户想在微信小程序里集成百度语音识别功能，需要教程和示例代码。先得理清楚步骤，可能包括申请API密钥、配置小程序权限、编写前端代码和后端交互，以及处理语音数据。首先，用户可能已经知道需要注册百度智能云账号，创建应用获取API Key和Secret Key。但需要详细说明步骤，比如进入语音技术页面，创建应用后的注意事项。还要确保用户填写正确的小程序AppID，这可能影响后续的权限配置。接下来是小程序端的配置。微信小程序需要录音权限，得在app.json里声明，用户可能容易忘记这一点。另外，服务器域名配置也很关键，需要将百度语音识别的API域名添加到request合法域名里，否则请求会被拦截。前端代码部分，用户需要录音管理接口，可能参考微信的RecorderManager。这里需要分步骤说明如何开始录音、结束录音并上传文件。代码示例要清晰，比如使用wx.startRecord已经废弃，应该用RecorderManager。同时，处理临时路径和上传到服务器的逻辑要明确，可能涉及Promise或回调函数。然后是服务器端，用户可能需要一个简单的后端，比如使用Node.js或PHP来处理token获取和语音识别请求。百度语音识别需要access_token，这需要后端用API Key和Secret Key去获取，避免在前端暴露敏感信息。示例代码需要展示如何通过HTTPS请求获取token，再调用语音识别接口。还要注意文件格式转换，百度支持的格式可能和小程序录制的格式不同，比如pcm转wav。用户可能需要使用第三方库或者手动添加WAV头信息，这部分需要给出具体的方法或代码片段，帮助用户处理格式问题。错误处理也是关键，比如网络请求失败、鉴权失败、格式不支持等情况，示例代码中应该包含success和fail的回调处理，方便用户调试。最后，测试环节需要提醒用户真机调试，因为录音功能在模拟器上可能无法正常使用。同时，检查域名配置和权限声明是否正确，避免常见问题。可能用户还会遇到跨域问题，或者百度接口返回的错误码，比如3300错误，这时候需要引导用户检查API密钥和文件格式。另外，小程序的文件上传大小限制也要注意，长语音可能需要分片处理，但基础教程可能先实现短语音识别。总结下来，步骤要分申请密钥、配置小程序、前端录音、后端处理、格式转换、错误处理几个部分，示例代码要简洁有效，覆盖主要流程。同时，引用相关资源，比如百度官方文档，帮助用户深入理解。</think>以下是在微信小程序中集成百度语音识别功能的完整实现方案： ### 一、准备工作 1. 注册百度智能云账号并创建应用 - 访问[百度AI开放平台](https://ai.baidu.com/) - 创建语音技术应用后获取`API Key`和`Secret Key`[^3] 2. 小程序配置 ```json // app.json { "permission": { "scope.record": { "desc": "需要获取您的录音权限" } } } ``` ### 二、前端实现 ```javascript // pages/index/index.js const recorderManager = wx.getRecorderManager() Page({ startRecord() { recorderManager.start({ format: 'pcm', sampleRate: 16000, numberOfChannels: 1 }) }, stopRecord() { recorderManager.stop() recorderManager.onStop((res) => { const { tempFilePath } = res this.uploadVoice(tempFilePath) }) }, uploadVoice(filePath) { wx.uploadFile({ url: 'https://your-server.com/api/baidu-asr', filePath, name: 'voice', formData: { token: '获取的access_token' }, success: (res) => { const result = JSON.parse(res.data) console.log('识别结果:', result.result) } }) } }) ``` ### 三、服务端示例（Node.js） ```javascript // server.js const axios = require('axios') // 获取access_token async function getToken(API_KEY, SECRET_KEY) { const url = `https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=${API_KEY}&client_secret=${SECRET_KEY}` const res = await axios.get(url) return res.data.access_token } // 语音识别接口 app.post('/api/baidu-asr', async (req, res) => { try { const token = await getToken(API_KEY, SECRET_KEY) const asrRes = await axios.post( `https://vop.baidu.com/server_api`, { format: 'pcm', rate: 16000, channel: 1, token: token, cuid: '小程序用户ID', speech: req.files.voice.data.toString('base64'), len: req.files.voice.size } ) res.json(asrRes.data) } catch (error) { console.error(error) res.status(500).json({ error: '语音识别失败' }) } }) ``` ### 四、注意事项 1. 格式转换建议： - 小程序录制的PCM音频需要添加WAV头信息 - 可以使用`pcm-to-wav`库进行转换 2. 百度语音识别支持格式： $$ \text{支持格式} = \{pcm, wav, amr, m4a\} \quad \text{采样率} \in \{8000, 16000\} $$ 3. 常见错误处理： - 3300错误：检查access_token有效性 - 3301错误：确认音频格式和参数匹配

小程序进行语音识别 音频MP3转PCM

小程序进行语音识别音频MP3转PCM