机器学习模型跟踪与部署实战
在机器学习模型的开发过程中,详细的记录工作贯穿始终。数据科学家会对源代码、超参数和训练数据进行修改,以获得更高质量的模型。跟踪与模型相关的参数、代码版本、输出指标和工件,是实现高效稳定机器学习开发的关键。
1. 模型跟踪基础
MLflow 提供了一个 API 端点(http://mlflow.data:5000 )用于跟踪模型开发。我们可以从新的 hc1 集群中的 JupyterHub(https://hub.hc1.apk8s.dev/ )打开 Jupyter 环境。
以下是使用 scikit-learn 的 ElasticNet 线性回归模型,结合葡萄酒质量数据集进行的一个示例,该示例改编自官方 MLflow 教程。
1.1 安装必要的包
在新的 Python 3 Jupyter Notebook 中,依次添加以下代码块作为单独的单元格:
!pip install mlflow==1.8.0
!pip install scikit-learn==0.23.1
!pip install boto3==1.10.35
1.2 设置环境变量
MLflow 需要以下环境变量:
import os
# api and object access
os.environ['MLFLOW_TRACKING_URI'] = "http://mlflow.data:5000"
os.environ['M
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



