机器学习模型训练、调优与部署全流程指南
1. 提交训练作业
当我们拥有一个可在本地调用的模块后,可将模块源文件存于云存储(如 gs://${BUCKET}/flowers-1.0.tar.gz ),随后向 Vertex Training 提交作业,让其在我们选定的云硬件上运行代码。
若要在单 CPU 机器上运行,需创建一个配置文件(如 cpu.yaml )来指定 CustomJobSpec :
workerPoolSpecs:
machineSpec:
machineType: n1-standard-4
replicaCount: 1
pythonPackageSpec:
executorImageUri: us-docker.pkg.dev/vertex-ai/training/tf-cpu.2-4:latest
packageUris: gs://{BUCKET}/flowers-1.0.tar.gz
pythonModule: flowers.classifier.train
args:
- --pattern="-*"
- --num_epochs=20
- --distribute="cpu"
启动训练程序时提供该配置文件:
gcloud ai custom-jobs create \
--region=${REGION} \
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



