由于作业需要就做了一个小玩意,原本想自己去训练模型的,但奈何功底不够深,以及其他各种原因,所以只能调接口来实现。尽管是调接口,其他的也是需要一些功底的。
一、准备工作
首先,你需要去百度AI开放平台注册账号并实名验证,之后在百度智能云可以申请创建应用,然后就可以获得自己的ID,密钥和api key,这都是在之后需要认证身份用的,其次就是需要了解一些Flask框架的知识,最后,需要导入如下模块:
from flask import Flask, render_template, request, redirect, url_for, send_file
import sounddevice as sd
import soundfile as sf
from aip import AipSpeech
其次,如果你使用的是Pycharm 社区版的话也是可以运行Flask框架的,专业版只是自动帮你创建了几个目录,社区版手动创建也是可以的(VScode以及其他的我没有试过)。
在你的项目下面手动创建static目录和templates目录,然后创建一个app.py的python文件(当然叫其他名字也行,他们三个是同级)。你的HTML文件放在templates目录里,CSS文件放在static文件里。
二、开始
1、准备HTML文件
我将CSS代码放在了HTML文件里,如果你单独写出来了也可以用link关键字来引用CSS文件,具体是在head里面导入,使用如下语句:
<link rel="stylesheet" type="text/css" href="文件路径">
我准备了三个HTML文件,一个是主界面,一个是语音识别成功后做了一个,一个是语音合成成功后做了一个(没有详细去做失败的页面,你要想做的话也可以)。
1.1 主页面
我简单的做了一个界面,能突出主要功能就行(你也可以在此基础上更加细腻完善)。
<!DOCTYPE html>
<html>
<head>
<meta charset=