问题背景
Iris flower数据集是1936年由Sir Ronald Fisher [ 1 ] \color{#0000FF}{[1]} [1]引入的经典多维数据集,可以作为判别分析(discriminant analysis)的样本。该数据集包含Iris的三个品种分别是山鸢尾 (Iris-setosa)、变色鸢尾(Iris-versicolor)和维吉尼亚鸢尾(Iris-virginica),各50个样本,每个样本还有4个特征参数,分别是萼片(sepals)的长宽和花瓣(petals)的长宽。假定现在出现了一株鸢尾植物,如何通过其所具有的特征来推断出它属于三类中的哪一类,这是机器学习中的典型的分类问题。
问题描述:试用模糊聚类相关方法分析。可分别选择聚类个数为3,4或5的情况下,得到聚类结果,并绘制相应图形。
模糊聚类及模糊推理系统
C均值模糊聚类
C均值模糊聚类(Fuzzy C-Means,FCM) [ 2 ] \color{#0000FF}{[2]} [2]是一种聚类方法,它允许一段数据属于两个或更多的聚类。在众多模糊聚类算法中,模糊C-均值(FCM)算法应用最广泛且较成功,它通过优化目标函数得到每个样本点对所有类中心的隶属度,从而决定样本点的类属以达到自动对样本数据进行分类的目的。它基于以下目标函数的最小化:
J m = ∑ i = 1 N ∑ j = 1 C u i j m ∥ x i − c j ∥ 2 , 0 ≤ m < ∞ {J_m} = \sum\limits_{i = 1}^N {\sum\limits_{j = 1}^C {u_{ij}^m} } {\left\| {
{x_i} - {c_j}} \right\|^2},0 \le m < \infty Jm=i=1∑Nj=1∑Cuijm∥xi−cj∥2,0≤m<∞
m m m是任何大于 1 1 1的实数, u i j u_{ij} uij是 x i x_i xi在集群j中的隶属度, x i x_i xi是第 i i i个 d d d维测量数据, c j c_j cj是簇的 d d d维中心,是表示任意测量数据与中心相似度的任意范数。
对上述目标函数进行迭代优化,对隶属度 u i j u_{ij} uij和聚类中心

本文介绍使用模糊C均值聚类和Takagi-Sugeno模糊推理系统对经典的Irisflower数据集进行分类的方法。通过实验对比了不同聚类数量下的分类效果,并利用Matlab实现了整个流程。
最低0.47元/天 解锁文章
1829





