优化预测成本与性能:SageMaker的实用技巧
在机器学习项目中,成本优化和性能提升是至关重要的。本文将介绍如何使用Amazon SageMaker Neo编译模型,以及如何在不同设备上部署模型,同时提供一份成本优化清单。
探索用Neo编译的模型
通过查看传递给 compile_model()
API的输出位置,我们可以看到Neo生成的模型工件:
$ aws s3 ls s3://sagemaker-eu-west-1-123456789012/dogscats/output-neo/
model-ml_c5.tar.gz
将其复制到本地并解压后,我们发现它包含原始模型及其编译版本:
$ aws s3 cp s3://sagemaker-eu-west-1-123456789012/dogscats/output-neo/model-ml_c5.tar.gz .
$ tar xvfz model-ml_c5.tar.gz
compiled.meta
model-shapes.json
compiled.params
compiled_model.json
compiled.so
特别地, compiled.so
文件是一个包含模型运算符硬件优化版本的原生文件: