机器学习手撕代码(3)k-means
- 本篇分享一下k-means的代码,k_means.py为K均值模型的代码。utils.py中为可视化结果的工具。
- dataset见本系列第0篇。
k_means.py
from datasets.dataset import DataSet
import matplotlib.pyplot as plt
import numpy as np
from sklearn import manifold
from utils import Visualization
from sklearn.model_selection import train_test_split
def dis(m,v): # 计算欧式距离返回n*1大小矩阵,为n条数据到v的距离
return np.sqrt(np.sum((m-v)**2,axis=1))
class KMEANS:
def __init__(self,n_clusters,rad_seed=2021):
self.n_clusters = n_clusters # 聚类中心个数
self.centers = [None]*self.n_clusters # 存放聚类中心
self.res = None
self.its = 0 # 记录迭代次数
self.rad_seed = rad_seed
def fit(self,data):
if self.rad_seed is not False:
np.random.seed(self.rad_seed)
for i in range(self.n_clusters):
self.centers[i] = data[i] # 从数据中随意选取n个数作为n个聚类中心的初始值
while(True): # 开始迭代求聚类中心
self.its+=1
distance = []
for i in range(self.n_clusters):

本文介绍了如何使用Python实现K-means算法,并通过实例演示了从数据预处理、模型训练到结果可视化的全过程,适合初学者理解聚类方法。
最低0.47元/天 解锁文章
1692

被折叠的 条评论
为什么被折叠?



