25、聚类算法：k-means与DBSCAN的深入解析与应用

最新推荐文章于 2025-09-06 13:45:00 发布

五行擒拿术

最新推荐文章于 2025-09-06 13:45:00 发布

阅读量24

点赞数

CC 4.0 BY-SA版权

分类专栏：动手学AI：从零到精通文章标签： k-means DBSCAN 聚类算法

本文链接：https://blog.youkuaiyun.com/table/article/details/152288400

动手学AI：从零到精通专栏收录该内容

77 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

聚类算法：k-means与DBSCAN的深入解析与应用

1. k-means算法的局限性

k-means算法具有快速和可扩展的优点，但并非完美。为避免次优解，需多次运行该算法，且要指定聚类的数量，这可能会带来一些麻烦。此外，当聚类的大小、密度不同或形状非球形时，k-means的表现不佳。例如，对于包含三个不同维度、密度和方向的椭球聚类的数据集，k-means无法很好地进行聚类。

在运行k-means之前，对输入特征进行缩放很重要，否则聚类可能会被拉伸，导致算法性能变差。虽然缩放特征不能保证所有聚类都是完美的球形，但通常有助于k-means算法的运行。

2. 聚类在图像分割中的应用

图像分割是将图像划分为多个部分的任务，主要有以下几种类型：
- 颜色分割 ：颜色相似的像素被分配到同一部分。在许多应用中，这种方法就足够了，例如分析卫星图像以测量某一地区的森林总面积。
- 语义分割 ：属于同一对象类型的所有像素被分配到同一部分。例如，在自动驾驶汽车的视觉系统中，行人图像的所有像素可能被分配到“行人”部分。
- 实例分割 ：属于同一单个对象的所有像素被分配到同一部分。在这种情况下，每个行人会有一个不同的部分。

下面我们使用k-means进行颜色分割：

import PIL
import numpy as np
from sklearn.cluster import KMeans

# 假设图像路径为filepath
fil

会员秒杀 ¥9.9 重磅福利

超级会员免费看