
机器学习
文章平均质量分 56
spark ml
xiaoxaoyu
小小鱼
展开
-
pyspark安装文档
pyspark环境安装一、python3环境安装参考文档:pyspark安装1、下载安装包生产环境下的python安装包,tgz格式,C语言,没有编译过的。Java可以跨平台,只能针对当前计算机https://www.python.org/ftp/python/3.6.4/也可以使用wget命令接上面的网址直接下载2、安装python可能用到的依赖:yum install openssl-devel bzip2-devel expat-devel gdbm-devel readline-de原创 2021-04-13 10:46:27 · 871 阅读 · 0 评论 -
Kmeans入门
文章目录Kmeans算法简单实现生成数据集重写fit和predict方法定义一个子绘图函数执行输出如下:完整代码解释如下:Kmeans算法简单实现平台:python训练数据集:sklearn模块下的数据集使用模块:import matplotlib.pyplot as plt:根据数据做出散点图from sklearn.datasets._samples_generator import make_blobsfrom scipy.spatial.distance import cdist:求原创 2021-04-11 17:45:28 · 568 阅读 · 0 评论