百度语音API——文本转语音

一、API

API(Application programming interface)应用程序编程接口:

是一组预先定义的函数和协议。

使得不同软件组件之间交互通信,充当了不同软件系统间的桥梁,允许开发者更容易地使用另一个软件系统提供的功能和服务,而无需了解其内部细节,简易开发。

二、前置条件

  1. 找到百度ai开放平台。

   链接:百度AI开放平台-全球领先的人工智能服务平台 (baidu.com)

  

2.依次点击:开放能力、语言技术、短语音识别。  

点击立即使用。

3.点击领取免费资源。(第一次是免费用的)  

4.选择语音识别的内容(这里我把全部都选了一遍,这个看自己情况)

全部勾选,以免之后用语音转文本的功能付钱。再点击,零元领取。

5.选中应用列表,然后创建应用。

6.  

7.下滑,点击个人,应用描述随意,然后点击创建。

8.复制信息。

  

三、代码实现

1.打开pycharm,安装baidu-aip

(安装百度提供的ai平台SDK‘software development kit’,即软件开发工具包,到你的python环境中,SDK能让开发者更方便地调用百度ai的服务。)

命令:pip install baidu-aip

2.从aip中导入相应的语音模块AipSpeech。

  命令:form aip import AipSpeech

  

3.从百度ai中复制appid,apikey,secrkey三个接口参数(这些参数用于标识用户,并为访问百度语音平台做签名验证。)

以他们为初始化对象。(使用他们来实例化AipSpeech客户端,并命名为client。)       

  

4.准备要合成语音的文本以及存放路径。

5.语音的合成:

调用client的synthesis方法来进行语音的合成。

参数包括要合成的文本,语言类型(这里是中文’zh’),语音音量(‘vol’),再print结果(正确就是一个二进制数据,错误就是字典类型)。

(dictionary字典:无序的,可变的容器,用于储存和检索数据。)

(client.synthesis是一个调用百度语音合成服务的方法,它接受文本作为输入,并返回合成的语音输入,实现文本到语音的转换,保存为音频文件。)

6.设置识别正确或错误的返回。

 isinstance(result,dict)作用是判断result是否为字典(dictionary)类型的对象,如果是将返回T,如果不是就会返回F。

如果结果不是字典,则打开指定文件夹路径,并将合成的语音数据写入文件。如果是字典,则print语音合成错误。

如果不是字典:

  

(open打开单引号里面的路径,‘w’表示写入模式,‘b’表示二进制模式打开文件夹,常用于处理音频,图像文件。)

(with语句,用于确保在代码块执行完毕后,无论是否发生异常,都会自动正确的关闭文件。)

(as f:将打开的文件对象赋值给变量f,在with代码块中可以通过f来操作文件。)

(f.write:将语音数据写入文件。)

否则:print语音合成错误。

  

7.总图

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值