数据聚类:模糊聚类与减法聚类的应用与实践
1. 数据聚类基础
数据聚类是许多分类和系统建模算法的基础。其目的是从大型数据集中识别出自然的数据分组,以简洁地表示系统的行为。模糊逻辑工具箱工具可以帮助我们在输入 - 输出训练数据中找到聚类。我们可以利用聚类信息生成一个Sugeno型模糊推理系统(FIS),该系统使用最少的规则来最佳地模拟数据行为。要自动生成这种类型的FIS,可以使用 genfis 命令。
2. 模糊C均值聚类(Fuzzy C - Means Clustering)
模糊C均值(FCM)是一种数据聚类技术,其中每个数据点以一定的隶属度属于某个聚类。该技术由Jim Bezdek在1981年提出,是对早期聚类方法的改进。它提供了一种将多维空间中的数据点分组到特定数量不同聚类的方法。
fcm 命令行函数首先对聚类中心进行初始猜测,这些中心旨在标记每个聚类的平均位置。初始猜测很可能是不正确的。此外, fcm 为每个数据点分配每个聚类的隶属度。通过迭代更新聚类中心和每个数据点的隶属度, fcm 将聚类中心移动到数据集中的正确位置。这种迭代基于最小化一个目标函数,该函数表示任何给定数据点到聚类中心的距离,并由该数据点在聚类中的隶属度加权。
fcm 函数输出一个聚类中心列表和每个数据点的多个隶属度。我们可以使用 fcm 返回的信息,通过创建隶属度函数来表示每个聚类的模糊特性,从而帮助构建模糊推理系统。要生成一个模拟输入/输出数据行为的Sugeno型模糊推理系统,可
超级会员免费看
订阅专栏 解锁全文
1261

被折叠的 条评论
为什么被折叠?



