百度Al在线语音合成(简单版)

百度AI语音合成就步骤

最新推荐文章于 2025-03-03 19:02:27 发布

原创最新推荐文章于 2025-03-03 19:02:27 发布 · 7.7k 阅读

8 ·

CC 4.0 BY-SA版权

语音合成专栏收录该内容

0 篇文章

订阅专栏

这篇博客介绍了如何使用百度AI在线语音合成功能。首先，需要登录百度账号并创建应用，获取APIKey和SecretKey。然后，将这些信息用于构造访问网址进行语音合成。文章还提到了查询电脑MAC地址的方法，并提供了官方学习网站和第三方在线转换工具的参考链接。

部署运行你感兴趣的模型镜像

百度Al在线语音合成(简单版)

1.登录网址

https://ai.baidu.com/tech/speech/tts

点击跳转

在这里插入图片描述

2.登录百度账号并创建应用

在这里插入图片描述

在应用列表创建新应用：全部默认。应用名称与描述自己填写

创建好得到如图：

在这里插入图片描述

创建成功后得到APIKey和SecretKey，替换到以下网址中

https://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentials&client_id=APIKEY&client_secret=SecretKey

例如：APIKey为1，SecretKey为2，网址则为

https://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentials&client_id=1&client_secret=2

3.替换后访问

得到一个json界面，复制其中的access_token中的代码，不要包括引号

在这里插入图片描述

4.补全以下网址

http://tsn.baidu.com/text2audio?lan=zh&tex="你需要转换的语音"&ctp=1&cuid=‎你电脑的MAC值&tok=4中复制的内容&vol=9&per=106&spd=6&pit=5&aue=3

补全后就可以访问在线转换语音了
$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9qsaU0GQ-1591501446051)(C:\Users\杨浪\AppData\Roaming\Typora\typora-user-images\1591500544666.png)]$
上面网址参数代表的意思：


参数	可需	描述
tex	必填	合成的文本，使用UTF-8编码。小于2048个中文字或者英文数字。（文本在百度服务器内转换为GBK后，
tok	必填	开放平台获取到的开发者access_token（见上面的“鉴权认证机制”段落）
cuid	必填	用户唯一标识，用来计算UV值。建议填写能区分用户的机器 MAC 地址或 IMEI 码，长度为60字符以内
ctp	必填	客户端类型选择，web端填写固定值1
lan	必填	固定值zh。语言选择,目前只有中英文混合模式，填写固定值zh
spd	选填	语速，取值0-15，默认为5中语速
pit	选填	音调，取值0-15，默认为5中语调
vol	选填	音量，取值0-15，默认为5中音量
per	（基础音库）	选填度小宇=1，度小美=0，度逍遥=3，度丫丫=4
per	（精品音库）	选填度博文=106，度小童=110，度小萌=111，度米朵=103，度小娇=5
aue	选填	3为mp3格式(默认)； 4为pcm-16k；5为pcm-8k；6为wav（内容同pcm-16k）; 注意aue=4或者6是语音识别要求的格式，但是音频内容不是语音识别要求的自然人发音，所以识别效果会受影响。