
数据挖掘
文章平均质量分 70
无心同学
这个作者很懒,什么都没留下…
展开
-
KNN算法(K-NearestNeighbor)详解(手写python代码实现+sklearn实现) 数据挖掘 分类算法 例子讲解 优缺点特点总结
为了判定未知样本的类别,以全部训练样本作为代表点,计算未知样本与所有训练样本的距离,并以最近邻者的类别较多的作为决策未知样本类别的唯一依据。度量方式包括:欧式距离,曼哈顿距离,切比雪夫距离等是一种基于实例的学习,需要一个邻近性度量来确定实例间的相似性或距离不需要建立模型,但分类一个测试样例开销很大,需要计算域所有训练实例之间的距离基于局部信息进行预测,对噪声非常敏感最近邻分类器可以生成任意形状的决策边界,决策树和基于规则的分类器通常是直线决策边界。...原创 2022-08-18 20:58:22 · 2976 阅读 · 3 评论 -
k-means算法详解(python实现) 数据挖掘 聚类分析 k均值算法
在开始k-means算法之前,我们先了解一下什么是聚类分析?聚类分析就是将数据划分成有意义或有用的组(簇),根据在数据中发现的描述对象及其关系的信息,将数据对象分组。其目标是,组内的对象相互之间是相似的,而不同组中的对象是不同的。所以很明确,这个算法是为了分类数据的,一般适用于市场细分、目标顾客定位、生物种群划分等邻域所以,k-means算法怎么理解呢?其中的k是聚类算法当中类的个数。 means指的就是均值算法。 k-means是采用均值算法把数据分成K个类的硬聚类算法!对于连续型属性原创 2021-11-06 20:28:24 · 6526 阅读 · 4 评论