前言
保姆级教程,从0开始带你从配置环境开始,上手一个语音识别的深度学习项目 wekws。
STEP1 安装miniconda3
进入到miniconda官网的安装网址,选择对应平台的安装方式,此处以linnux平台为例。当然你也可以选择安装Anaconda。
Installing Miniconda — Anaconda documentation
将指令复制,逐条输入到命令行中,等待其自动安装。安装完成后会在根目录下看到一个miniconda
的文件夹,使用命令ls
可以进行查看当前目录下的文件。
如果在安装时选择默认激活conda,那么就会在用户前面看到(base)
如果没有,则需要手动初始化一下conda,使用命令:
source miniconda/bin/activate
STEP2 克隆远程仓库
此处选择一个端到端的语音识别项目,wekws: Production First and Production Ready End-to-End Keyword Spotting Toolkit
点开后找到git clone链接,或者下划找到作者README下的Installation,直接复制代码。
在Linux命令窗口中输入代码后回车,就能在目录里看到wekws
的文件夹了。
STEP3 配置项目运行环境
根据Installation中的第二个方框中的代码,逐行输入到Linux的命令窗口中,就能自动完成环境的配置。一定要先初始化conda
整个安装过程几乎不用管,只用一直输入‘y’
有时由于网络问题,会出现连接超时等报错,则需要在运行pip安装对应包时,加上-i
选项,换为国内镜像源。
pip install -r requirement.txt -i <source>
- 中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/
- 豆瓣(douban) http://pypi.douban.com/simple/
- 清华大学 https://pypi.tuna.tsinghua.edu.cn/simple/
第二行代码运行之后便激活了基础的Python环境,接着转到wekws的目录下,再运行第三行代码:
cd ~/wekws
pip install -r requirements.txt
可以通过下面的命令,查看环境是否配置完善:
conda list
STEP4 运行项目
使用下面的命令,就可以开始运行你的第一个深度学习项目了
cd examples/speechcommand_v1/s0/
bash run.sh
当然,很有可能在运行的过程中出现莫名奇妙的报错,那么可能需要在VScode中进行调试。
STEP5 查看结果
当模型训练结束后会生成一个tensorboard
的文件夹,你可以使用Python中的tensorboard包,可视化训练过程,观察Loss的变化趋势等。只需要在终端中输入如下命令:
tensorboard --logdir=<your log directory> --port=<your port>
根据提示,在浏览器中访问对应端口,就能看到图表了。
如果有什么问题,欢迎在评论区交流!谢谢你的阅读!