基于AWS的深度学习模型训练与围棋机器人部署
1. AWS上的模型训练
在将文件存储好后,可在终端中输入 ssh aws 连接到AWS实例。首次连接时,会询问是否确认连接,输入 yes 并按回车键提交命令,密钥将永久添加到实例(可通过 cat ~/.ssh/authorized_keys 查看密钥对的安全哈希值),之后不会再询问。
首次成功登录深度学习AMI Ubuntu AMI实例时,会提供几个Python环境供选择。若想使用Python 3.6并完整安装Keras和TensorFlow,可执行 source activate tensorflow_p36 ;若选择Python 2.7,则执行 source activate tensorflow_p27 。后续假设使用实例自带的基本Python版本。
在运行应用程序前,需了解如何终止实例。若忘记关闭昂贵的实例,每月可能产生数百美元的费用。终止实例的操作步骤如下:
1. 选中实例(点击旁边的复选框)。
2. 点击页面顶部的 “Actions” 按钮。
3. 依次选择 “Instance State” 和 “Terminate”。
终止实例会删除该实例及其上存储的所有内容,因此在终止前需复制所需内容(如训练好的模型)。另一个选择是停止实例,之后可再次启动,但根据实例的存储配置,可能会导致数据丢失,此时会有警告提示。
在AWS上运行深度学习模型与本地运行类似,需确保实例上有所有所需的代码和数据。可使用 scp <
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



