通过CodeArts API设计语音合成接口

1 概述

1.1 案例介绍

CodeArts API是华为云API全生命周期管理一体化协作平台,支持开发者高效实现API设计、API开发、API测试、API托管、API运维、API变现的一站式体验。通过以API契约为锚点,CodeArts API保证API各阶段数据高度一致,为开发者提供友好易用的API全流程端到端解决方案。

API Explorer提供API接口、代码示例、场景示例、CLI示例等多种开发集成方式,适用于 API调试、故障排查等多种场景。通过控制台访问API Explorer,更方便的验证API请求,更直观的查看返回结果,当调用出错时,API Explorer会显示相应的错误信息,并提示如何解决。

CodeArts IDE是一个跨平台的集成开发环境(IDE),它将精简的源代码编辑器与强大的开发者工具结合在一起。

1.2 适用对象

  • 企业
  • 个人开发者
  • 高校学生

1.3 案例时间

本案例总时长预计40分钟。

1.4 案例流程

61bfcf89d10a12dd8dc3d3b105c0e7e1.png{{{width="40%" height="auto"}}}

说明:

  1. 通过CodeArts API创建API项目并设计语音API;
  2. 通过API Explorer调试语音合成API生成语音数据流;
  3. 实验Demo工程源码拉取并导入工程到编辑器完成运行准备;
  4. 运行Demo生成将语音数据流合成音频文件。

1.5 资源总览

资源名称规格单价(元)时长(分钟)
CodeArts API服务网页体验版免费40
API Explorer/免费40
开发者空间-云主机鲲鹏通用计算增强型 kC2 | 4vCPUs | 8G | Ubuntu免费40

2 通过CodeArts API设计语音合成API

2.1 开发者空间配置

面向广大开发者群体,华为开发者空间提供一个随时访问的“开发桌面云主机”、丰富的“预配置工具集合”和灵活使用的“场景化资源池”,开发者开箱即用,快速体验华为根技术和资源。

进入华为开发者空间工作台界面,点击打开云主机 > 进入桌面连接云主机。 如果还没有领取云主机进入工作台界面后点击配置云主机,选择Ubuntu操作系统。 a1aae6ff53aac98855ef597dd6899967.png

552fc96c3b58a06e294e4a760ae719e3.PNG

2.2 创建API项目

进入云主机后,在火狐浏览器中,输入CodeArts API官网地址:https://developer.huaweicloud.com/develop/codeartsapi.html 进入官网。

image.png

进入官网后,点击“立即体验”按钮并登录。

6d68fb7eed8611556c3a2ed51edc6e22.PNG

登录后点击页面右上角的“创建项目”按钮。

0f8a37d3085a6ea0c8a306fbfa3b76b6.PNG

在创建项目弹窗中输入项目名称:“语音合成”,并点击确定按钮。

e17e3f1a8b2572036b9a7089a98a1533.PNG

2.3 设计语音API

创建项目成功后,点击“API设计->新建API接口”进入到API设计页面。

d26a7dd026de0249a657f20db91cc219.PNG image.png

输入接口的URL:/tts;operationld:test,摘要输入:语音合成。

image.png

在请求参数区域,点击请求体“Body”页签,选择“raw”,默认选择的“JSON”格式。

97af2d3c24441564640e0d5593663315.PNG

输入参数,类型为“sting”,描述修改为“待合成的文本”。

ea206f92248df0aeedebc0a209821286.PNG

在返回响应区域,返回数据类型为“string”,将描述修改为“合成结果”。

da1bd04871ef80b03143eb48fe9dc359.PNG

最终点击页面右上角的“保存”按钮,完成API设计的保存。

00a540f0f3f5ae4b93492bc55580f09f.png

可在默认目录下,查看到新增的API。

25584f6f5eb739d67fb765d3f6fa8f7a.PNG

2.4 调试API,生成音频数据流

进入云主机,在火狐浏览器中,输入API Explorer地址:https://console.huaweicloud.com/apiexplorer/#/openapi/SIS/debug?api=RunTts

在打开的页面中,填入请求参数,之后调用API,获取音频数据流;

相关名词解释:

语音格式:wav是一种无损音频文件格式,常用于存储高质量的音频数据;mp3是一种有损音频压缩格式,通过减少音频数据中的冗余信息来减小文件大小,同时保持较高的音质;pcm是一种非压缩的音频格式,它直接将模拟音频信号转换为数字信号,不进行任何压缩处理。

采样率:表示每秒钟从连续音频信号中采集的样本数量。采样率越高,音频信号的还原度越高,音质越好。

语速和音高:语速表示语音播放的速度,通常以每分钟播放的字符数或单词数来衡量。音高表示语音的音调高低,通常以赫兹(Hz)或相对值来衡量。

举例说明:

生成语音格式为wav,采样率:8000,‘chinese_xiaoqi_common‘,语速0,音高0(表示生成wav格式的语音,采样率为8000Hz,使用‘chinese_xiaoqi_common’语音包,语速和音高均为默认0,其他场景类似)

生成语音格式为wav,采样率:16000,‘chinese_xiaoyu_common’,语速0,音高0

生成语音格式为mp3,采样率:8000,‘chinese_xiaoqi_common‘,语速100,音高100

生成语音格式为mp3,采样率:16000,‘chinese_xiaoyu_common’,语速100,音高100

生成语音格式为pcm,采样率:16000,‘chinese_xiaoyu_common’,语速100,音高100

以下是本案例输入的请求参数:

text:华为云语音合成;audio_format:wav;sample_rate:16000;property:chinese_xiaoyu_common;speed:0;pitch:0

操作示例如下图:

5d78f16d1ef56fddc00bf342e39233a0.PNG

将每次API Explorer调试请求得到的response,点击下载,生成“SIS_RunTts_ResponseBody_xxxxxxxxxxxxx.json”文件(如果没有下载选项,就直接复制返回文本,存入自建xxxx.json文件),文件存储到任意位置备用。

be9fb6bfef5441fc38392bd5ea9df2e0.PNG

2.5 转换音频数据流为音频文件

Demo工程下载链接:https://sandbox-expriment-files.obs.cn-north-1.myhuaweicloud.com/2601/CodeArtsProject.zip 打开下载文件夹,鼠标右击“open terminal Here”打开终端,输入以下命令进行解压。

unzip +压缩包的名称

image.png

在华为云控制台新增访问秘钥,配置AK/SK。

访问华为云控制台:

https://console.huaweicloud.com/iam/?agencyId=599e2ee1492f48e9b69a0a682d435fb8®ion=cn-north-4&locale=zh-cn#/mine/accessKey

选择“我的凭证”->“访问秘钥”-> 新增访问秘钥(若有密钥可以不用新增),输入描述:“我的秘钥”,点击单选框,再点击“继续创建”按钮。

b35af6bf504d011f282f2d3d9db422e9.PNG

创建秘钥成功后点击“立即下载”,即可获得“credentials.csv”文件,里面可以查看到AK(Access Key Id)和SK(Secret Access Key)。

f8dab267ca6d8eafc76eca0e9076d78b.PNG

使用CodeArts IDE for Java编辑器打开下载的demo工程,进行工程文件的加载,等待编辑器完成工程配置。(注:大概需要3-5分钟请耐心等待)

image.png

进入工程,进入目录src/main/resources下选择credentials.properties,将AK/SK配置上,配置完成后对文件进行保存。 image.png

步骤2.4的API Explorer上调试成功的任意一个音频数据流文件文本内容复制到APIResponse.json中,并保存文件。

image.png

执行“should_return_audio_when_response_json”,生成mp3格式音频文件; 找到test目录下的测试类SisServiceTest.java,点击“开始执行”按钮,正确运行后将会在目录下生成音频文件。 image.png 目录下生成“devkit.mp3”文件;获得转换后的音频文件。 image.png

至此,通过CodeArts API设计语音合成接口的案列内容已全部完成。

2.6 反馈改进建议

如您在案例实操过程中遇到问题或有改进建议,可以到论坛帖评论区反馈即可,我们会及时响应处理,谢谢!

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值