数据挖掘-基础知识-汇总笔记1

本文深入探讨了多种聚类算法,包括k-means、k-medoids、k-modes、fuzzy k-modes、k-prototypes及w-k-means。解析了各算法的特点,如k-means对异常值的敏感性,k-medoids的中心点选择方式,k-modes对分类变量数据的处理等,为读者提供了全面的聚类算法概览。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

分类:有监督;聚类:无监督;


1.k-means:连续型,数值型数据,使用欧式距离(余弦距离)“大哥-小弟”的例子,无监督学习算法;形心均值是相加再除即可;对异常值敏感


--k-medoids:形心均值改为中心点,在每个聚簇中按照顺序依次选取点,计算该点到当前聚簇中所有点距离之和,最终距离之和最小的点,则视为新的中心点。计算量比上一个大。


2.k-modes;只是处理分类变量数据;使用汉明距离:不同属性值的个数, 差异度越小,则表示距离越小


3.fuzzy k-modes;模糊;1999年论文有;


4.k-prototypes;基于原型,含有数值型数据也含有分类数据,一种能同时处理两种不同类型数据的聚类方法;时间复杂度比较高;


5.w-k-means;基于权重的k-means算法;

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值