Sklearn实现Brich聚类

The Birch 为给定数据构建一棵 Characteristic Feature Tree (CFT,聚类特征树)。 数据实质上是被有损压缩成一组 Characteristic Feature nodes (CF Nodes,聚类特征节点)。 CF Nodes 有许多称为 Characteristic Feature subclusters (CF Subclusters) 的子簇,并且这些位于非终结位置的CF Subclusters 可以拥有 CF Nodes 作为子节点。

CF Subclusters 保存用于簇的必要信息,防止将整个输入数据保存在内存中。 这些信息包括:

Number of samples in a subcluster(子簇中样本数).
Linear Sum - A n-dimensional vector holding the sum of all samples(保存所有样本和的n维向量)
Squared Sum - Sum of the squared L2 norm of all samples(所有样本的L2 norm的平方和).
Centroids - To avoid recalculation linear sum / n_samples(为了防止重复计算 linear sum / n_samples).
Squared norm of the centroids(质心的 Squared norm ).

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值