这篇是当时小学期的时候跟着老师学的一点,虽说是 KMeans 算法的使用,但使用的太浅显了,代码就仅几行,后来我去专门找了下关于 KMeans 聚类的博客,发现确实是老师讲的太少了。但由于时间关系,暂时没时间去深入学了,这里就放一下当时学的那一点。
开始之前先放一个要用到的文件:提取码 : u47s 。对于这样一个表格数据:
需要做的是对这一些数据进行聚类,划分为三类:超级vip客户,vip 客户 以及普通用户。下面进入正题:
一、读取数据
import pandas as pd
data = pd.read_csv('company.csv',encoding='gbk')
# print(type(data))
print(data)
# 数据->矩阵
mat = data.as_matrix()
#返回一个二元数组,每一条数据就是一个数组
print(type(mat))
print(mat)
# 删除年龄数据,年龄不作为标准
inX = mat[:,1:]
</