今天试用了一下Spark的机器学习,体验如下:
第一步,导入数据
我们使用Iris数据集,做一个分类,首先要把csv文件导入。这里用到了spark的csv包,不明白为什么这么常见的功能不是内置的,还需要额外加载。
--packages com.databricks:spark-csv_2.11:1.4.0
结果如下:
今天试用了一下Spark的机器学习,体验如下:
第一步,导入数据
我们使用Iris数据集,做一个分类,首先要把csv文件导入。这里用到了spark的csv包,不明白为什么这么常见的功能不是内置的,还需要额外加载。
--packages com.databricks:spark-csv_2.11:1.4.0
结果如下: