处理缺失数据的无监督多内核学习方法与智能机床识别技术
1. 无监督多内核ELM方法
在处理数据时,常常会遇到数据不完整或未标记的情况。而无监督多内核ELM方法在这方面展现出了一定的潜力,但处理缺失数据或不完整的基础内核仍是一个难题。
1.1 两步无监督多内核ELM(TUMK - ELM)
TUMK - ELM是ELM的扩展,它结合了ELM和多内核组合(MKC)。通过采用多个内核迭代提取信息,为原始数据学习一组最优的组合内核。与其他MKC方法相比,它能以解析解的方式获得最优内核组合系数,速度比数值解更快,满足大数据时代处理大量数据和实时学习的要求。其采用两步策略来获取聚类信息和多内核组合系数:
- 第一步 :生成K - 空间。数据由多个内核构建,根据学习到的最优组合内核分配伪标签。给定数据集X从K到U的变换形式为:
[u(x_i,x_i) = [K_1,(x_i,x_j), K_2,(x_i,x_j), \cdots, K_k,(x_i,x_j)]]
其中(\forall x_i, x_j \in X),(K_i)是第i个内核矩阵,(u_{x_i,y_i})是U中对应X中对象(x_i)和(x_j)的元素。进行内核k - 均值聚类后,根据生成的标签c为K - 空间中的数据(u_{x_i,x_j})分配伪标签(t_{x_i,x_j}):
[t(x_i,x_j) =
\begin{cases}
0, & c_i = c_j \
1, & c_i \neq c_j
\end{cases}
]
- 第二步
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



