一、API
API(Application programming interface)应用程序编程接口:
是一组预先定义的函数和协议。
使得不同软件组件之间交互通信,充当了不同软件系统间的桥梁,允许开发者更容易地使用另一个软件系统提供的功能和服务,而无需了解其内部细节,简易开发。
二、前置条件
- 找到百度ai开放平台。
链接:百度AI开放平台-全球领先的人工智能服务平台 (baidu.com)
2.依次点击:开放能力、语言技术、短语音识别。
点击立即使用。
3.点击领取免费资源。(第一次是免费用的)
4.选择语音识别的内容(这里我把全部都选了一遍,这个看自己情况)
全部勾选,以免之后用语音转文本的功能付钱。再点击,零元领取。
5.选中应用列表,然后创建应用。
6.
7.下滑,点击个人,应用描述随意,然后点击创建。
8.复制信息。
三、代码实现
1.打开pycharm,安装baidu-aip
(安装百度提供的ai平台SDK‘software development kit’,即软件开发工具包,到你的python环境中,SDK能让开发者更方便地调用百度ai的服务。)
命令:pip install baidu-aip
2.从aip中导入相应的语音模块AipSpeech。
命令:form aip import AipSpeech
3.从百度ai中复制appid,apikey,secrkey三个接口参数(这些参数用于标识用户,并为访问百度语音平台做签名验证。)
以他们为初始化对象。(使用他们来实例化AipSpeech客户端,并命名为client。)
4.准备要合成语音的文本以及存放路径。
5.语音的合成:
调用client的synthesis方法来进行语音的合成。
参数包括要合成的文本,语言类型(这里是中文’zh’),语音音量(‘vol’),再print结果(正确就是一个二进制数据,错误就是字典类型)。
(dictionary字典:无序的,可变的容器,用于储存和检索数据。)
(client.synthesis是一个调用百度语音合成服务的方法,它接受文本作为输入,并返回合成的语音输入,实现文本到语音的转换,保存为音频文件。)
6.设置识别正确或错误的返回。
isinstance(result,dict)作用是判断result是否为字典(dictionary)类型的对象,如果是将返回T,如果不是就会返回F。
如果结果不是字典,则打开指定文件夹路径,并将合成的语音数据写入文件。如果是字典,则print语音合成错误。
如果不是字典:
(open打开单引号里面的路径,‘w’表示写入模式,‘b’表示二进制模式打开文件夹,常用于处理音频,图像文件。)
(with语句,用于确保在代码块执行完毕后,无论是否发生异常,都会自动正确的关闭文件。)
(as f:将打开的文件对象赋值给变量f,在with代码块中可以通过f来操作文件。)
(f.write:将语音数据写入文件。)
否则:print语音合成错误。
7.总图