MLflow v0.8.1具有更快的实验UI和增强的Python模型

最新推荐文章于 2025-07-04 00:03:52 发布

原创

最新推荐文章于 2025-07-04 00:03:52 发布 · 625 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#MLflow #spark #databricks #示说网

MLflow v0.8.1本周发布。它引入了几个UI增强功能，包括数千次运行的更快加载时间，以及在使用许多指标和参数进行导航运行时提高响应速度。此外，它扩展了对作为Apache Spark UDF评估Python模型的支持，并自动将模型依赖性捕获为Conda环境。

现在可以在[PyPI]和在线文档中使用，您可以pip install mlflow按照MLflow快速入门指南中的说明安装此新版本。

说明链接：https://mlflow.org/docs/latest/quickstart.html

在这篇文章中，我们将详细介绍几个MLflow v0.8.1功能：

在数百或数千次运行的导航实验中，可以获得更快，响应更快的MLflow UI体验

当作为Spark UDF加载时扩展pyfunc_model的功能。这些UDF现在可以返回多个标量或字符串列。

添加了在保存模型时自动捕获Conda环境中的依赖关系的支持，确保可以在新环境中加载它们

能够从ZIP文件运行MLflow项目

更快更好的MLflow UI体验

databricks一直致力于为ML开发人员提供愉快的体验，此版本增加了对MLflow实验UI的进一步增强：

更快地显示实验：改进的MLflow UI可以快速显示数千个实验运行，包括所有相关参数和工件。训练大量模型的用户应该观察更快的响应时间。

使用交互式散点图进行更好的可视化：用于比较运行的散点图现在是交互式的，可以更深入地了解模型性能特征。

增强的Python模型作为Spark UDF

将Python模型评分为Apache Spark UDF时，用户现在可以通过从扩展的结果类型集中进行选择来过滤UDF输出。例如，指定

pyspark.sql.types.DoubleTypeUDF输出的过滤器的结果类型，并返回包含双精度标量值的第一列。指定结果类型将

最低0.47元/天解锁文章

200万优质内容无限畅学