聚类算法之AP算法

最新推荐文章于 2021-09-16 21:41:48 发布

hb707934728

最新推荐文章于 2021-09-16 21:41:48 发布

阅读量2.8k

点赞数

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/hb707934728/article/details/71404263

本文深入探讨了聚类算法中的凝聚层次聚类（Agglomerative Clustering，简称AP算法）。首先介绍了AP的基本原理，包括如何通过距离度量构建层次结构。接着详细讲解了AP的步骤，包括计算相似矩阵、构建距离树以及剪枝过程。最后，通过实例分析展示了AP算法在实际数据集上的应用效果，并与K-means进行了对比，强调了AP在处理非球形分布和不同大小簇时的优势。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Preference: -5.29914553034
mul= 1.0
p=1.0 -5.29914553034 聚类簇的个数为: 16

# -*- coding:utf-8 -*-

import numpy as np
import matplotlib.pyplot as plt
import sklearn.datasets as ds
import matplotlib.colors
from sklearn.cluster import AffinityPropagation
from sklearn.metrics import euclidean_distances

#聚类算法之AP算法:
#1--与其他聚类算法不同,AP聚类不需要指定K(金典的K-Means)或者是其他描述聚类个数的参数
#2--一个聚类中最具代表性的点在AP算法中叫做Examplar,与其他算法中的聚类中心不同,examplar
#是原始数据中确切存在的一个数据点,而不是由多个数据点求平均而得到的聚类中心
#3--多次执行AP聚类算法,得到的结果完全一样的，即不需要进行随机选取初值步骤.
#算法复杂度较高,为O(N*N*logN),而K-Means只是O(N*K)的复杂度，当N》3000时,需要算很久
#AP算法相对于Kmeans优势是不需要指定聚类数量,对初始值不敏感

#AP算法应用场景：图像、文本、生物信息学、人脸识别、基因发现、搜索最优航线、 码书设计以及实物图像识别等领域

#算法详解: http://blog.youkuaiyun.com/helloeveryon/article/details/51