阿里云深度学习采坑记

最新推荐文章于 2025-04-30 12:42:44 发布

ayz54599

最新推荐文章于 2025-04-30 12:42:44 发布

阅读量286

点赞数

文章标签：人工智能 python

原文链接：http://www.cnblogs.com/bbird/p/9837798.html

版权

原因

打算研究下AI，以便不那么落后于这个时代，但是看了看，搞一个能支持AI算法的显卡就要天文数字。所以找到了阿里云的PAI平台，打算跑跑自己写的算法，采坑无数，搞了两天才搞定。

基本流程

阿里云提供了官方的教程：如果打算把自己的深度学习代码到阿里云PAI上运行的话，照着官方文档去试试：https://help.aliyun.com/document_detail/49571.html?spm=a2c4g.11186623.6.570.1c3564f9tpM92k#读OSSBucket

踩过的坑（需要注意事项）

数据文件

自己写的python代码本身读取数据和保存模型都在本地，可能做了硬编码，如果要迁移到阿里云，需要从OSS上读写文件。那么需要做下修改

1、首先需要设置一个让获得阿里云关于OSS配置的参数

if __name__ == '__main__':
        parser = argparse.ArgumentParser()
        parser.add_argument('--buckets', type=str, default='',help='input data path')
        parser.add_argument('--checkpointDir', type=str, default='',help='output model path')
        FLAGS, _ = parser.parse_known_args()

2、在程序中这样获得数据文件和模型保存的位置

tfrecords_file = os.path.join(FLAGS.buckets, "post_train.tfrecords")
        
        checkpoint_path = os.path.join(FLAGS.checkpointDir, 'model.ckpt')