一、模糊聚类分析的核心思想
在实际工程技术和经济管理问题中,我们常常需要对对象进行分类。例如,根据生物特征对物种分类、根据气候特征对城市分类、根据用户行为对客户群体分类等。传统的聚类分析基于清晰的分类边界,但现实中许多分类问题具有模糊性——类与类之间的界限并不分明。例如,"青年"与"中年"的年龄界限、空气质量等级的划分等。
模糊聚类分析正是为了解决这类模糊分类问题而提出的方法。它通过建立模糊关系矩阵,结合模糊数学理论,将对象的相似性转化为数值化的隶属度,从而实现对模糊类别的动态划分。
二、模糊等价矩阵:分类的数学基础
2.1 模糊等价矩阵的定义
设 R = ( r i j ) n × n R = (r_{ij})_{n \times n} R=(rij)n×n 是一个 n n n 阶模糊矩阵,若满足以下三个条件:
- 自反性: r i i = 1 r_{ii} = 1 rii=1(对角线元素全为1);
- 对称性: r i j = r j i r_{ij} = r_{ji} rij=rji(矩阵对称);
- 传递性: R ∘ R ⊆ R R \circ R \subseteq R R∘R⊆R(即 R 2 ≤ R R^2 \leq R R2≤R);
则称 R R R 为模糊等价矩阵。
传递性的直观解释
传递性保证了若 x i x_i xi 与 x j x_j xj 相似, x j x_j xj 与 x k x_k xk 相似,则 x i x_i xi 与 x k x_k xk 必须具有一定程度的相似性。数学上通过模糊矩阵的合成运算来验证:
R 2 = R ∘ R , 其中 c i j = max 1 ≤ k ≤ n { r i k ∧ r k j } R^2 = R \circ R, \quad \text{其中} \quad c_{ij} = \max_{1 \leq k \leq n} \{ r_{ik} \land r_{kj} \} R2=R∘R,其中cij=1≤k≤nmax{ rik∧rkj}
若 R 2 ≤ R R^2 \leq R R2≤R(即所有元素满足 c i j ≤ r i j c_{ij} \leq r_{ij} cij≤rij),则 R R R 满足传递性。
2.2 模糊等价矩阵的性质
定理:若 R R R 是模糊等价矩阵,则对任意 λ ∈ [ 0 , 1 ] \lambda \in [0,1] λ∈[0,1],其 λ \lambda λ-截矩阵 R λ R_\lambda Rλ 是经典等价矩阵(布尔矩阵)。
λ \lambda λ-截矩阵的定义
对模糊矩阵 R R R,给定阈值 λ \lambda λ,构造布尔矩阵 R λ R_\lambda Rλ:
a i j ( λ ) = { 1 , r i j ≥ λ 0 , r i j < λ a_{ij}^{(\lambda)} = \begin{cases} 1, & r_{ij} \geq \lambda \\ 0, & r_{ij} < \lambda \end{cases} aij(λ)={ 1,0,rij≥λrij<λ
动态分类特性
当 λ \lambda