scikit-learn做k-means做聚类分析的流程

本文介绍了一种基于Python的数据预处理及K-means聚类分析的方法。通过使用sklearn库进行最大最小值归一化处理后,利用K-means算法对数据集进行了聚类,并将结果可视化展示。此外,还提供了将聚类结果保存到Excel文件的过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

-- coding: utf-8 --

import csv
import numpy
from sklearn import preprocessing
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from sklearn import metrics
import xlwt
from sklearn.preprocessing import Imputer

if name == ‘main‘:
读取数据
with open(‘E:/1.csv’, ‘r’) as CreditSocringData:
read1 = csv.reader(CreditSocringData)
read1= numpy.array(list(read1), dtype=’float64’)
CreditSocringData.close()
数据预处理
X=read1[0:read1.shape[0],0:read1.shape[1]]
最大最小值归一化
min_max_scaler = preprocessing.MinMaxScaler()
X_min_max = min_max_scaler.fit_transform(X)
散点图
plt.scatter(X_min_max[:,0], X_min_max[:, 1], marker=’o’)
plt.show()
聚类分析
y_pred = KMeans(n_clusters=5,random_state=9).fit_predict(X_min_max)
plt.scatter(X_min_max[:,0 ], X_min_max[:, 1], c=y_pred)
print( y_pred)
保存所聚的类别
book=xlwt.Workbook(encoding=’utf-8’,style_compression=0)
sheet=book.add_sheet(‘sheet1’,cell_overwrite_ok=True)
for i in range(y_pred.shape[0]):
sheet.write(i,0,y_pred[i])
book.save(‘E:/Kmeanslabel.xls’)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值