scikit-learn之聚类算法之Affinity Propagation

本文介绍了scikit-learn库中的Affinity Propagation聚类算法,包括基本概念如exemplar、相似度矩阵、偏好参数等。算法流程包括计算相似度矩阵、更新吸引度和归属度,以及确定代表样本。该算法无需预设聚类数量,但存在较高的时间和空间复杂度。在sklearn中,可通过设置参数如damping、max_iter和preference来调整算法行为。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

基本概念

exemplar: 聚类的中心点;
s(i,k): 样本 i 和样本 k 之间的相似度,初始化时会有一个相似度矩阵;
preference: 偏好参数(参考度),指相似度矩阵中横轴纵轴索引相同的点,如s(i,i),表示数据点 i 作为聚类中心的程度。迭代开始前假设所有点成为聚类中心的能力相同,因此参考度一般设为相似度矩阵中所有值得最小值或者中位数,但是参考度越大则说明各数据点成为聚类中心的能力越强,则最终聚类中心的个数越多;
r(i,k): responsibility(吸引度),样本 k 适合作为样本 i 的聚类中心的累积信任度;
a(i,k): availability(归属度),样本 i 应该选择样本 k 作为其聚类中心的累积信任度;
damping factor: 阻尼系数,为了避免 r(i,k) 和 a(i,k) 在更新时发生数值震荡;

算法流程

1、计算初始的相似度矩阵,将各点之间的吸引度 r(i,k) 和归属度 a(i,k) 初始化为 0;
2、更新各点之间的吸引度,随之更新各点之间的归属度,公式如下:
这里写图片描述
这里写图片描述
这里写图片描述
其中, λ \lambda

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值