导入模块
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.preprocessing import StandardScaler
from sklearn.cluster import KMeans
查看数据基本信息
该案例的数据集下载地址:
customers_df = pd.read_csv('customers.csv', sep=',', encoding='utf-8')
customers_df.head()
一般由于数据中存在异常值,不同数据之前也存在量纲,所以会对数据集进行标准化处理,KMeans模型不会被异常数据影响,本案例中数据提前处理过,所以可以直接使用。
KMeans模型应用
X = customers_df.iloc[:, [3,4]].values
k_means = KMeans(n_clusters = 5, init = 'k-means++', random_state = 42)
y_means = k_means.fit_predict(X)
在