机器学习中的多视图学习与深度KNN算法解析
1. 多视图学习概述
多视图学习是一种让机器学习算法通过多种方式观察训练示例的学习类型。在传统的单视图学习中,一个原始数据项通常被编码为单一表示;而在多视图学习里,一个原始数据项会被转换为多个表示,从而准备出多组表示。
1.1 多重编码
- 单编码 :单编码是将原始数据映射到一种结构化形式的过程。在单编码中,假设只有一组属性,一个原始数据项被编码为一个数值向量,并且只准备一组训练示例来训练机器学习算法,这是传统机器学习中常见的方式。
- 多编码系统 :多编码系统是从单编码系统扩展而来的。通过各种从候选特征中选择特征的方案,可以定义多个特征集。这些特征集可以进一步划分为子集,从一组原始训练示例中可以准备出多组表示训练示例。例如,在图中展示的情况,一个机器学习算法会用三个视图进行训练。
- 属性交换 :通过不同的特征选择方案可以得到两组属性,在这两组属性之间交换一些属性,又可以得到另外两组属性。这种交换类似于遗传算法中两条染色体的交叉,能产生更多不同的视图。
1.2 多视图监督学习
多视图学习在监督学习算法中的实现,主要是通过使用多重编码方案或将属性集划分为多个子集,来准备多组作为原始数据项表示的训练示例。
- 属性集划分 :属性集是通过特定方案从候选特征中选择的特征集合,其特征子集被视为一个视图。为了实现多视图学习,可以准备多个属性子集,也可以采用多种从候选特征中选择特
超级会员免费看
订阅专栏 解锁全文
1265

被折叠的 条评论
为什么被折叠?



