这一分析方法会用到的库有——pandas、sklearn
部分原始数据如图所示:
首先我们需要导入所需用到的库:
import pandas as pd
from sklearn.preprocessing import StandardScaler
from sklearn.cluster import KMeans
其次我们需要将数据进行获取及标准化处理:
Data=pd.read_excel("高等教育发展数据.xlsx")
X=Data.iloc[:,1:]
scaler=StandardScaler()
scaler.fit(X)
X=scaler.transform(X)
紧接着我们会得到标准化处理之后的数据如下所示:
现在正式进行k-means聚类分析:
1、导入k-means聚类模块:
from sklearn.cluster import KMeans
2、利用KMeans创建K-均值聚类对象:
model=KMeans(n_clusters=4,random_state=0,max_iter=500)
设置的