讯飞开方平台语音识别步骤

最新推荐文章于 2023-02-28 18:20:41 发布

原创最新推荐文章于 2023-02-28 18:20:41 发布 · 3.5k 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#java #android #css3

android 专栏收录该内容

11 篇文章

订阅专栏

本文介绍了在Android应用开发中遇到的SDK整合问题，包括如何下载并导入SDK，处理samplespeechDemo内容，解决libmsc.so缺失导致的对象创建失败问题，以及针对RecognizerDialog的提示问题。提供了在MainActicity中初始化添加代码，以及在build.gradle中调整sourceSets的解决方法，确保jniLibs和assets目录正确设置。

1、创建新应用后点击管理，在右边找SDK，下载对应的版本

2、把sample\speechDemo里面的内容粘贴到对应的位置

3、提示创建对象失败请确认libmsc.so，

原因1：demo里面缺少注册，需要在Mainacticity中初始化的时候添加代码

SpeechUtility.createUtility(this.getApplicationContext(),"appid=" + getString(R.string.app_id));

原因2：bulid.gradle中没有导入LIB，将SDK中的libs全部拷进项目的libs，文件夹下包含对应的libmsc.so，然后修改bulid.gradle中的android——sourceSets——main

sourceSets {
        main {
            jniLibs.srcDirs = ['libs']
            assets.srcDirs = ['assets']
        }
    }

其一是解决libmsc.so问题，其二是解决RecognizerDialog提示findViewWithTag为空问题。

4、关闭提示，缓冲进度为**，播放进度为**，在TtsDemo中关闭showTip即可。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

SDFCF

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【语音识别】基于matlab GUI HMM中文语音识别【含Matlab源码 1385期】

订阅付费专栏Matlab（奶茶价版），可赠送奶茶价版付费专栏指定代码1份；

10-11

2404

HMM中文语音识别 完整的代码，方可运行；可提供运行操作视频！适合小白！

基于Python实现人脸识别相似度对比

商务合作 / 项目定制 / 学习交流。个人vx：lovely_wml

01-23

9418

随着人工智能技术的不断进步，人脸识别成为了一种广泛应用的技术。人脸相似度对比是其中的一个重要应用场景，可以用于人脸搜索、身份验证等方面。本文将介绍如何使用Python实现人脸相似度对比。

参与评论您还未登录，请先登录后发表或查看评论

Android接入讯飞sdk使用，遇到的问题和解决

lw1389074的博客

10-10

2506

Android接入讯飞sdk使用，遇到的问题和解决

机器语音之科大讯飞SDK在ros中的下载和使用

工大机器人工作室

04-12

5045

如题，首先登陆科大讯飞的开放平台右上角点击注册，按步骤完成注册。成功登陆后，点击控制台。点击创建新应用，随便填写下，完成后，会出现你的项目名称，APPID是针对你使用的SDK的ID，点击右侧的SDK下载。首次进入和我的不同，要选择添加新功能，然后再点亮你要下载的，然后下载至待保存路径。下载完成后，解压，复制压缩包下的/libs/x64文件下的库文件lib...

讯飞语音SpeechUtility.createUtility阻塞当前进程

pang9998的博客

09-30

1999

今天在使用讯飞语音的SDK的时候，发现在平板上退出App重新打开App显示白屏，而在手机上面一切正常！经过层层调试，发现在Application中对SDK初始化的时候，主线程阻塞在了以下语句中： SpeechUtility.createUtility(appContext, param.toString()); 不应该呀，难道是*.so文件的原因？或者是SDK自带的bug？？？经验证，...

讯飞语音听写与合成demo

07-12

本Demo集成了讯飞在线听写与合成SDK，实现了精准的在线听写，包括外部音频识别；以及在线语音合成功能

用讯飞开放平台的语音识别SDK实现最简单的语音识别功能

qq_43307916的博客

11-06

1172

1.先去官网下载对应的SDK文件解压后如下所示将libs文件夹下的jar文件放到项目中的libs中之后再点击如下按钮更新gradle文件。再在app–>main目录下新建一个名为jniLibs的文件夹，将解压后的libs文件夹中的其他（除jar文件）文件添加到jinLibs文件夹下。再将assets文件夹添加到main目录下。再在sample中给的例子中找到JsonP...

科达讯飞语音集成出现 couldn't find "libmsc.so" 这个错误

weixin_39413778的博客

10-19

4293

解决方案：需要在libs 目录下放置： Msc.jar arm64-v8a armeabi-v7a 也就是说 .jar 和 .so 的文件都需要在libs目录下放置 src/main/jniLibs 目录下放置关于 .so的文件 build.gradle 文件中需要进行下面的配置， //配置JNILibs sourceSets { main { ...

C#WINFROM讯飞语音识别源码

03-20

源码描述：一、菜单功能 1、实现C# 调用科大讯飞语音识别和语音合成API 2、实现基本的语音识别和语音播报二、注意事项 1、开发环境为Visual Studio 2012，无数据库，使用.net 4.0开发。

基于Java一线医疗平台开方功能的SDK设计源码

10-09

本项目作为一款针对一线医疗平台的开方功能SDK设计源码，是专为医疗信息系统提供定制化解决方案的关键技术组件，其设计与实现对于提升医疗服务质量，优化患者就医体验具有重要意义。首先，该项目包含的Java源文件...

【飞桨PaddleSpeech语音技术课程】— 语音唤醒

小湉湉的博客

10-27

3003

【飞桨PaddleSpeech语音技术课程】— 语音唤醒

树莓派官方交叉编译器

12-16

树莓派官方交叉编译器,树莓派官网提供的下载链接服务器在国外太慢了,这边提供一个,方便国内玩家下载.为 bcm2708hardfp.

AndroidStudio测试讯飞听写遇到的问题和我的解决办法

xurongxin2006的博客

12-07

1194

今天在做人工智能产品开发时，需要用到“科大讯飞”的“语音听写（流式版）”Demo，测试用语音控制设备操作可行性；在按照“语音听写 Android SDK 文档”操作，将代码移植后，并编译到测试手机上后，发现提示“创建对象失败，请确认libmsc.so放置正确，且有调用createUtility进行初始化”错误，如下图所示：网上找了很多办法，官方的工单也看了，大半天都解决不了。后来，看到csdn上有个博主有同样的问题，感觉莫大的欢喜，于是用他的方法试试，也没解决。最终，在试来试去过程中，无意间解决了这个问题

在用cmake编译语音识别时出现的问题

wyw1749750673的博客

02-28

523

cc1: warning: command line option ‘-std=c++11’ is valid for C++/ObjC++ but not for C /usr/bin/ld: 找不到 -lmsc /usr/bin/ld: 找不到 -lmsc collect2: error: ld returned 1 exit status collect2: error: ld returned 1 exit status robot_voice/CMakeFiles/tts_subscribe.di

关于libmsc.so文件加载到Android Studio中

liu_qin_bin的博客

08-07

3102

最近遇到在AndroidStuido中科大讯飞的语音功能中加载.so文件出错的事件，感到很烦恼，网上也没有具体的资料，因此就自己摸索了一个晚上，提供给大家一个参考，希望有所帮助。第一步：在main中创建一个文件夹jniLibs，然后将我们含有.so文件放到里面去第二步：看图中的备注可知，要在build.gradle中的android{}添加以下代码第三步：查

常见问题整理

myxuan475的专栏

07-09

1426

link_image[1964]: 15498 could not load needed library 'libmsc.so' for './ttstest' (load_library[1091]: Library 'libmsc.so' not found)CANNOT LINK EXECUTABLE

安卓学习日记——语音识别

chen_xiaoke的博客

05-22

515

科大讯飞语音官网：https://www.xfyun.cn/ 1注册，2登录，3创建应用，4下载SDK 导入jar包同时将libs中的文件夹全都复制到自己创建的jniLibs目录中

error while loading shared libraries...cannot open shared object file: No such file or directory解决办法

weixin_44530917的博客

10-24

3867

error while loading shared libraries...cannot open shared object file: No such file or directory解决办法原理解决办法VIM编辑器的简介与语法案例原理之所以会报错，简而言之是因为程序中你用的库函数不在linux系统默认的搜索范围内。解决办法我们要将报错的…所在的目录加到系统库函数搜索路径中即可。首先输入命令 cd ~切换到主目录再输入命令ls -a显示隐藏文件找到.bashrc文件利用VIM编辑器

讯飞在线命令识别动态库交叉编译后找不到的问题

goodchoes的专栏

06-25

3012

环境配置: 树莓派B+ , ubuntu 14.04, ROS, wiringPi, vs1003B, 讯飞在线语音识别库系统功能: 通过vs1003的麦克风采集声音,然后将声音转码为讯飞要求的pcm格式,然后在树莓派中调用讯飞提供的在线命令识别API,完成语音识别功能. 碰到的问题: 开始时从网上找了比较流行的a

使用内置语音识别功能编写

最新发布

06-16

<think>我们使用MATLAB内置的语音识别功能，即`audiorecorder`和`speech2text`函数（注意：`speech2text`是R2022a引入的函数，如果使用更早版本，需要其他方法）。由于之前代码中使用了`speechClient`，现在改为使用内置功能。我们将修改语音识别部分：1.移除`speechClient`相关的初始化。2.在停止录音后，将录音数据保存为临时WAV文件，然后使用`speech2text`进行识别。3.由于内置的`speech2text`不支持置信度，因此我们直接使用识别结果。注意：`speech2text`函数需要AudioToolbox，并且需要安装相应的语音识别模型支持包（如：EnglishLanguageSpeechRecognitionModel）。修改后的类定义如下：</think>### 使用 MATLAB 内置语音识别功能的语音计算器实现以下是完全基于 MATLAB 内置语音识别功能的语音计算器实现方案，不依赖任何外部云服务。该方案使用 `audiorecorder` 捕获语音，通过 `speech2text` 函数进行语音识别，然后计算表达式并显示结果。 ```matlab classdef BuiltInSpeechCalculator < handle properties % GUI components Fig RecordButton StatusLamp StatusLabel ExpressionField ResultLabel HistoryArea % Audio objects Recorder IsRecording = false % Recognition parameters Fs = 16000 % Sampling rate (Hz) TempFile = 'temp_recording.wav' % Temporary audio file end methods function app = BuiltInSpeechCalculator % Create main figure app.Fig = uifigure('Name', 'MATLAB Speech Calculator', ... 'Position', [100 100 450 500], ... 'CloseRequestFcn', @(src,event) app.closeApp()); % Create record button app.RecordButton = uibutton(app.Fig, 'push', ... 'Text', 'Start Recording', ... 'Position', [50 420 150 30], ... 'ButtonPushedFcn', @(btn,event) app.toggleRecording()); % Create status lamp app.StatusLamp = uilamp(app.Fig, ... 'Position', [220 425 20 20], ... 'Color', [0.5 0.5 0.5]); % Gray = idle % Create status label app.StatusLabel = uilabel(app.Fig, ... 'Position', [250 420 150 20], ... 'Text', 'Status: Idle'); % Create expression display uilabel(app.Fig, 'Text', 'Recognized Expression:', ... 'Position', [50 380 150 20]); app.ExpressionField = uitextarea(app.Fig, ... 'Position', [50 330 350 50], ... 'Editable', false); % Create result display uilabel(app.Fig, 'Text', 'Calculation Result:', ... 'Position', [50 280 150 20]); app.ResultLabel = uilabel(app.Fig, ... 'Position', [50 250 350 30], ... 'Text', '', ... 'FontSize', 16, ... 'FontWeight', 'bold'); % Create history panel uilabel(app.Fig, 'Text', 'Calculation History:', ... 'Position', [50 200 150 20]); app.HistoryArea = uitextarea(app.Fig, ... 'Position', [50 50 350 150], ... 'Editable', false); % Check if speech recognition is available if ~app.checkSpeechRecognition() uialert(app.Fig, 'Speech recognition not available. Install support packages.', 'Error'); app.RecordButton.Enable = 'off'; end end function available = checkSpeechRecognition(app) % 检查语音识别功能是否可用 available = false; try % 尝试创建测试语音识别模型 model = speechClient('model', 'wav2vec2.0-base-960h'); available = true; catch try % 尝试使用内置函数 if exist('speech2text', 'file') available = true; end catch available = false; end end end function toggleRecording(app) if app.IsRecording % Stop recording app.IsRecording = false; stop(app.Recorder); app.RecordButton.Text = 'Start Recording'; app.StatusLamp.Color = [0.5 0.5 0.5]; % Gray app.StatusLabel.Text = 'Status: Processing...'; drawnow; % 强制更新UI try % 保存录音到临时文件 audioData = getaudiodata(app.Recorder, 'double'); audiowrite(app.TempFile, audioData, app.Fs); % 使用内置语音识别 transcript = app.recognizeSpeech(); % 处理识别结果 if isempty(transcript) app.ResultLabel.Text = 'ERROR: No speech detected'; else app.processExpression(transcript); end app.StatusLabel.Text = 'Status: Ready'; catch ME app.StatusLabel.Text = 'Status: Error'; uialert(app.Fig, ME.message, 'Recognition Error'); end else % Start recording app.IsRecording = true; app.Recorder = audiorecorder(app.Fs, 16, 1); % 16-bit mono record(app.Recorder); app.RecordButton.Text = 'Stop Recording'; app.StatusLamp.Color = [1 0 0]; % Red app.StatusLabel.Text = 'Status: Recording...'; app.ExpressionField.Value = ''; app.ResultLabel.Text = ''; end end function transcript = recognizeSpeech(app) % 使用内置语音识别功能 try % 方法1: 使用speech2text函数 (R2022a+) [audioData, fs] = audioread(app.TempFile); transcript = speech2text(audioData, fs); catch try % 方法2: 使用speechClient本地模型 model = speechClient('model', 'wav2vec2.0-base-960h'); [audioData, fs] = audioread(app.TempFile); results = recognize(model, audioData, fs); transcript = results(1).Transcript; catch % 方法3: 基本语音识别（需要安装支持包） transcript = app.basicSpeechRecognition(); end end end function transcript = basicSpeechRecognition(app) % 基本语音识别实现（如果高级功能不可用） % 注意：这需要安装Audio Toolbox和必要的支持包 % 加载预训练的语音识别模型 try net = load('voiceRecognitionModel.mat'); % 示例模型文件 [audioData, fs] = audioread(app.TempFile); % 预处理音频 features = extractAudioFeatures(audioData, fs); % 使用深度学习模型进行预测 predicted = classify(net, features); transcript = char(predicted); catch transcript = 'ERROR: Recognition failed'; end end function processExpression(app, transcript) % Display recognized speech app.ExpressionField.Value = transcript; try % Convert speech to math expression mathExpr = app.convertSpeechToMath(transcript); % Evaluate expression safely result = app.safeEval(mathExpr); % Display result app.ResultLabel.Text = ['= ' num2str(result)]; % Add to history history = app.HistoryArea.Value; newEntry = [transcript ' = ' num2str(result)]; if isempty(history) app.HistoryArea.Value = {newEntry}; else app.HistoryArea.Value = [history; newEntry]; end catch ME app.ResultLabel.Text = ['ERROR: ' ME.message]; end end function mathExpr = convertSpeechToMath(~, transcript) % 增强版语音到数学表达式的转换 transcript = lower(transcript); % 特殊数学函数处理 functionMap = { 'sine', 'sin'; 'cosine', 'cos'; 'tangent', 'tan'; 'logarithm', 'log'; 'natural log', 'log'; 'square root', 'sqrt'; 'exponential', 'exp'; 'pi', 'pi'; 'euler', 'exp(1)' }; for i = 1:size(functionMap, 1) transcript = strrep(transcript, functionMap{i,1}, functionMap{i,2}); end % 运算符替换 operatorMap = { 'plus', '+'; 'minus', '-'; 'times', '*'; 'multiplied by', '*'; 'divided by', '/'; 'over', '/'; 'to the power of', '^'; 'squared', '^2'; 'cubed', '^3'; 'open parenthesis', '('; 'close parenthesis', ')'; 'point', '.'; 'dot', '.'; 'modulo', 'mod'; 'percent', '*0.01' }; for i = 1:size(operatorMap, 1) transcript = strrep(transcript, operatorMap{i,1}, operatorMap{i,2}); end % 数字转换 numberMap = { 'zero', '0'; 'one', '1'; 'two', '2'; 'three', '3'; 'four', '4'; 'five', '5'; 'six', '6'; 'seven', '7'; 'eight', '8'; 'nine', '9'; 'ten', '10'; 'eleven', '11'; 'twelve', '12'; 'thirteen', '13'; 'fourteen', '14'; 'fifteen', '15'; 'sixteen', '16'; 'seventeen', '17'; 'eighteen', '18'; 'nineteen', '19'; 'twenty', '20'; 'thirty', '30'; 'forty', '40'; 'fifty', '50'; 'sixty', '60'; 'seventy', '70'; 'eighty', '80'; 'ninety', '90'; 'hundred', '*100'; 'thousand', '*1000' }; for i = 1:size(numberMap, 1) transcript = strrep(transcript, numberMap{i,1}, numberMap{i,2}); end % 处理复合数字（如 twenty-two） transcript = regexprep(transcript, '(\d+)\s*-\s*(\d+)', '$1$2'); % 移除多余空格 transcript = strtrim(transcript); % 移除非数学字符（保留基本数学函数） mathExpr = regexprep(transcript, '[^a-zA-Z0-9_\.\+\-\*/\^]', ''); end function result = safeEval(~, expr) % 安全评估数学表达式 if isempty(expr) error('Empty expression'); end % 验证允许的字符和函数 validPattern = '[a-zA-Z0-9_\.\+\-\*/\^]'; if ~all(regexp(expr, validPattern)) error('Invalid characters in expression'); end % 允许的安全函数列表 allowedFunctions = {'sin', 'cos', 'tan', 'log', 'exp', 'sqrt', 'pi'}; % 检查函数调用是否安全 functionCalls = regexp(expr, '\<[a-zA-Z]+\>', 'match'); for i = 1:length(functionCalls) if ~any(strcmp(allowedFunctions, functionCalls{i})) error(['Unsupported function: ' functionCalls{i}]); end end % 使用str2num进行安全评估 try result = eval(expr); % 更灵活的计算 % 或者使用更安全的选项：result = str2num(expr); catch error('Could not evaluate expression'); end end function closeApp(app) % 清理资源 if app.IsRecording stop(app.Recorder); end % 删除临时文件 if exist(app.TempFile, 'file') delete(app.TempFile); end delete(app.Fig); end end end ``` ### 安装和使用说明 #### 1. 安装必要支持包在运行前，需要安装MATLAB的语音识别支持包： ```matlab % 在MATLAB命令窗口运行 audioToolboxSupportPackages % 打开支持包安装器 ``` 选择安装： - Speech Recognition Toolbox - Audio Toolbox - 英语语音识别模型（English Language Speech Recognition Model） #### 2. 运行应用 ```matlab app = BuiltInSpeechCalculator; ``` #### 3. 语音输入示例 - "two plus three times five" - "sine of pi divided by two" - "ten squared minus five" - "log of one hundred" ### 技术实现细节 #### 语音识别实现方式 1. **`speech2text` 函数 (推荐)** - R2022a及以上版本内置函数 - 直接处理音频数据 - 示例用法： ```matlab [audioData, fs] = audioread('recording.wav'); transcript = speech2text(audioData, fs); ``` 2. **本地语音识别模型** - 使用预训练的wav2vec2.0模型 - 需要安装支持包 - 示例代码： ```matlab model = speechClient('model', 'wav2vec2.0-base-960h'); results = recognize(model, audioData, fs); transcript = results(1).Transcript; ``` 3. **自定义语音识别模型** - 训练自己的深度学习模型 - 需要语音数据集和深度学习工具箱 - 基本流程： ```matlab % 训练一个简单的语音识别模型 layers = [ ... sequenceInputLayer(numFeatures) lstmLayer(200) fullyConnectedLayer(numClasses) softmaxLayer classificationLayer]; options = trainingOptions('adam', ... 'MaxEpochs', 20, ... 'Plots', 'training-progress'); net = trainNetwork(audioData, labels, layers, options); ``` #### 表达式处理增强 1. **数学函数支持** - 支持三角函数(sin/cos/tan) - 支持对数(log)和指数(exp) - 支持开方(sqrt)和常数(pi) 2. **复杂数字转换** - 基本数字：zero → 0, one → 1 - 复合数字：twenty-two → 22 - 大数字：hundred → *100, thousand → *1000 3. **安全评估机制** - 允许字符白名单验证 - 安全函数白名单(sin, cos等) - 异常处理防止崩溃 ### 常见问题解决方案 1. **"speech2text未定义"错误** - 安装语音识别支持包 - 确保MATLAB版本为R2022a或更高 - 备用方案：使用`speechClient`本地模型 2. **识别准确率低** - 在安静环境中录音 - 清晰发音数学术语 - 使用简单表达式结构 - 扩展转换字典 3. **计算错误处理** - 添加更多表达式转换规则 - 增强`safeEval`函数的错误检测 - 实现表达式语法验证 4. **临时文件权限问题** - 更改临时文件路径： ```matlab app.TempFile = fullfile(tempdir, 'calc_recording.wav'); ``` - 添加文件删除错误处理