异常值检测与聚偏二氟乙烯梁的挠电响应研究
1. 基于谱聚类的异常值检测算法
1.1 异常值指数
聚类后,需要挖掘异常点,为此引入了异常值指数。首先给出以下定义:
设 (C = {C_1, …, C_k}),且 (|C_1| \geq … \geq |C_k|),其中 (|C_i|) 表示簇 (C_i)((i = 1, …, k))中对象的数量,(k) 是簇的数量。给定两个正数 (\alpha) 和 (\beta),若以下方程成立,则定义 (b) 为大小聚类的边界:
[|C_1| + … + |C_b| \geq |D|\alpha \quad (8)]
[|C_b|/|C_{b + 1}| \geq \beta \quad (9)]
这样,大簇的集合可定义为 (LC = {C_i|i \leq b}),小簇的集合可定义为 (SC = {C_j|j > b})。定义 1 给出了一种量化大小聚类的方法。方程 (8) 表明大簇的数据占整个数据的比例为 (\alpha),因此包含大量数据对象的簇为大簇。而公式 (9) 表明大簇是小簇的 (\beta) 倍,这意味着大簇和小簇在规模上必须有足够的差距,从而可以忽略小聚类对数据集的影响。
对于数据集中的任何对象 (x),其异常值指数因子(FOO)为:
[FOO(x) = \frac{1}{|C_i|dist(x, C_i)} \quad (10)]
其中,(dist(x, C_i)) 是对象 (x) 与簇 (C_i) 中心的欧几里得距离,(|C_i|) 是簇 (C_i) 中对象的数量。
1.2 改进的谱聚类算法步骤
输入:包含 (
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



