Spark PipelineModel 目录 由来 PipelineModel的概述 使用PipelineModel进行预测 保存和加载PipelineModel 官方链接 1. 由来 PipelineModel 是 Spark MLlib 中的一个类,用于表示通过 Pipeline 构建的完整数据处理和模型训练流水线。它是对整个流水线的封装,可以用于进行预测或推断。 2. PipelineModel的概述 PipelineModel 表示一个完整的数据处理和模型训练流水线,它由多个 PipelineStage 组成。在流水线中,每个 PipelineStage 可能是一个 Transformer 或一个 Estimator。 通过调用 fit 方法在训练数据上拟合整个流水线,会得到一个训练好的 PipelineM