MLflow v0.8.1本周发布。它引入了几个UI增强功能,包括数千次运行的更快加载时间,以及在使用许多指标和参数进行导航运行时提高响应速度。此外,它扩展了对作为Apache Spark UDF评估Python模型的支持,并自动将模型依赖性捕获为Conda环境。
现在可以在[PyPI]和在线文档中使用,您可以pip install mlflow按照MLflow快速入门指南中的说明安装此新版本 。
说明链接:https://mlflow.org/docs/latest/quickstart.html
在这篇文章中,我们将详细介绍几个MLflow v0.8.1功能:
在数百或数千次运行的导航实验中,可以获得更快,响应更快的MLflow UI体验
当作为Spark UDF加载时扩展pyfunc_model的功能。这些UDF现在可以返回多个标量或字符串列。
添加了在保存模型时自动捕获Conda环境中的依赖关系的支持,确保可以在新环境中加载它们
能够从ZIP文件运行MLflow项目
更快更好的MLflow UI体验
databricks一直致力于为ML开发人员提供愉快的体验,此版本增加了对MLflow实验UI的进一步增强:
更快地显示实验:改进的MLflow UI可以快速显示数千个实验运行,包括所有相关参数和工件。训练大量模型的用户应该观察更快的响应时间。
使用交互式散点图进行更好的可视化:用于比较运行的散点图现在是交互式的,可以更深入地了解模型性能特征。
增强的Python模型作为Spark UDF
将Python模型评分为Apache Spark UDF时,用户现在可以通过从扩展的结果类型集中进行选择来过滤UDF输出。例如,指定
pyspark.sql.types.DoubleTypeUDF输出的过滤器的结果类型,并返回包含双精度标量值的第一列。指定结果类型将
p