多视图构建方法全解析
1. 多视图学习与视图构建概述
在日常生活中,多视图数据十分常见。比如视频由视觉和听觉部分组成,网页包含文本和图像两种视图。多视图学习的发展使得利用数据的多视图特性成为可能,但多视图数据通常来自特定应用,存储和处理需要更多资源,多数情况下只有单视图数据可用。不过,我们可以通过从单视图数据生成多个视图来从多视图学习中获益。
视图构建并非随意为之,需要遵循一些指导原则。一方面,生成的视图要能充分代表数据,满足多视图模型假设,理想情况下,两个视图的假设应在同一示例上达成一致,即遵循视图共识原则;另一方面,多视图学习算法常假设视图之间条件独立,在多数情况下,这一假设可被较弱的视图互补原则替代。这两个原则是许多多视图学习算法的基础,生成视图时需加以考虑,以确保算法性能。
以下将介绍几种视图构建方法,包括三种简单方法和三种基于神经网络的方法。
2. 特征集划分
将单视图数据的特征集划分为不相交的子集,每个子集代表一个视图,是生成多视图的自然方法。当特征具有实际意义时,划分容易进行。
2.1 示例
在人体动作识别实验中,实验室人员身体周围配备50个传感器,提供描述人体姿势和动作的50维特征集。根据传感器位置,可自然地将其划分为不同组,每组监测人体某部分的运动,这些组即为不同视图。
2.2 通用表示
假设单视图数据集D包含D个示例,每个示例有m个属性,即x = {x1, x2, …, xm},属性索引集为A = {1, 2, .., m}。为生成V个视图,将索引集划分为V个不相交的子集,即A = ∪i Ai 且 Ai ∩ Aj = ∅(i ≠
超级会员免费看
订阅专栏 解锁全文
926

被折叠的 条评论
为什么被折叠?



