问题是这样的,如果我们想基于pyspark开发一个分布式机器训练平台,而xgboost是不可或缺的模型,但是pyspark ml中没有对应的API,这时候我们需要想办法解决它。
还可以参考:https://github.com/MachineLP/Spark-/tree/master/pyspark-xgboost
测试代码: ( (pyspark使用可以参考这个:https://blog.youkuaiyun.com/u014365862/article/details/87825398 ))
#!/usr/bin/env python
# -*- coding:utf8 -*-
"""
-------------------------------------------------
Description : pyspark测试
Author : liupeng
Date : 2019/7/23
-------------------------------------------------
"""
impo