机器学习笔记 - 机器学习中的聚类算法

本文详细介绍了聚类的基本概念、应用场景以及多种聚类算法的思想,包括基于分布、质心、连通性、密度和层次的算法。还探讨了如K-Means、DBSCAN、Mean Shift等流行算法,并通过实例展示了它们的效果。最后推荐了PyClustering和CLASSIX两个聚类算法库。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、聚类简介

1、概述

        实质上是机器学习中的一种无监督学习方法。并不需要我们对数据进行标记。通常,它被用作在一组示例中找到有意义的结构、解释性基础过程、生成特征、进行分组的等。

        聚类是将总体或数据点划分为多个组的任务,以使同一组中的数据点与同一组中的其他数据点更相近。

         例如下面的分簇

但是簇不总是规则形状的。

2、常见应用 

        在癌细胞的识别中:聚类算法被广泛用于癌细胞的识别。它将癌性和非癌性数据集分为不同的组。</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

坐望云起

如果觉得有用,请不吝打赏

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值