机器学习中的多视角学习与深度KNN算法
1. 多视角学习
1.1 多重编码
在机器学习中,将原始数据项编码为多种表示形式是多视角学习的重要基础。传统的机器学习采用单编码方式,即把原始数据映射为一种结构化形式,每个数据项被编码为一个数值向量,且仅准备一组训练示例来训练机器学习算法。
而多重编码系统是单编码系统的扩展。可以通过从特征候选集中选择特征的各种方案来定义多个特征集,这些特征集又可划分为子集。例如,从一组原始训练示例中可以准备三组表示训练示例,此时机器学习算法会基于这三个视角进行训练。
此外,还可以通过交换两组属性来生成更多不同的视角,这一思路源自遗传算法中两条染色体的交叉。在单视角学习中,原始数据项被编码为单一表示;而在多视角学习中,单个原始数据项会被转换为多种表示,并准备多组表示,还可通过属性交换获得更多视角。若使用单个机器学习算法,则需要考虑将多种表示集成到单一表示中。
1.2 多视角监督学习
多视角学习在监督学习算法中的实现,是通过使用多重编码方案或将属性集划分为多个子集,来准备多组作为原始数据项表示的训练示例。多视角学习以独立模型的形式实现,每个机器学习算法使用自己的训练示例集进行训练,每个视角对应一个机器学习算法。
具体操作如下:
1. 属性集划分 :将属性集(即通过特定方案从特征候选集中选择的特征集)划分为子集,每个特征子集被视为一个视角。可以通过多种选择特征的方案准备多个属性集,并基于这些属性子集准备多组训练示例。
2. 独立训练算法 :为每个训练示例集独立分配一个机器学习算法,
超级会员免费看
订阅专栏 解锁全文
17万+

被折叠的 条评论
为什么被折叠?



