SVM研究展望

本文探讨了支持向量机在大数据时代的挑战,包括最大间隔思想、非线性学习和深度SVM的研究。在最大间隔与稀疏损失函数方面,提出了寻找数据边界低密度区域的新思路;在非线性学习中,讨论了核函数的构造和大型核矩阵的计算问题;同时展望了深度SVM与广度SVM的理论模型和算法发展。

方向

回归问题、多分类问题、多示例问题、多标记问题、多视角问题、特征压缩问题、时间序列问题、半监督学习问题[和无监督学习问题, 而且包括深度学习 和广度学习 等新的研究热点

  • 从理论上研究如何提高各种 SVM 的泛化能力使其达到期望风险更紧的上界;
  • 从模型上研究新的正则化项、损失函数和核函数的构建及其适用范围;
  • 由于 SVM 需要求解优化问题, 相应的快速求解算法也是一个研究方向.

在传统机器学习中, SVM 已被公认为是处理小样本机器学习问题的典范技术. 然而, 到了当今大
数据时代, 数据多呈现规模巨大和数据价值密度低等新的特点, 这使得 SVM 的发展遇到了新的重大
挑战. 同时, 相对于深度学习和强化学习等新学习范式的蓬勃发展, SVM 的研究陷入了低谷. 本文摒
弃将它们对立的观点, 而强调它们的融合与交叉. 我们将从剖析支持向量机的本质出发, 探讨一些新
的研究思路. 具体包括支持向量机 3 个方面的问题: 最大间隔思想与稀疏性、核函数与相应的统计学
习理论, 以及浅层学习到深度学习与广度学习. 同时, 从这 3 个方面分别提出潜在的挑战性课题, 并展
望可能的发展方向.

1. SVM 最大间隔 (寻找数据边界低密度区域思想) 和稀疏损失函数

如何在大规模和数据价值密度低的数据中找到有价值的信息, 是当今大数据时代的主要课题之一.
因此, SVM 最大间隔 (寻找数据边界低密度区域思想) 和稀疏损失函数的进一步研究意义非凡. 展望
的研究工作如下:

  • 经典 SVM 最大间隔是对两类数据中点与点之间而言的, 最大间隔还可考虑数据粒度之间的间
    隔、数据局部的间隔、数据分布之间的间隔和不同度量意义下的间隔等多种形式. 利用不同的最大
    间隔思想识别不同数据边界低密度区域的研究很有意义, 特别是对大规模数据的处理.
  • 支持向量是数据边界稀疏一侧且不易充分正确划分的数据点输入, 支持向量具有构造决策和
    重构数据边界等功能, 价值密度较高. 因此, 在大数据中支持向量及其价值值得深入研究. 例如, 利用
    支持向量进行数据压缩和数据表达, 利用支持向量寻找或构造重要数据和特征等问题. 此外, 构造更加
    稀疏的支持向量的模型和寻求高效算法也是很有价值的问题.
  • 构造并研究新的稀疏损失函数也是当前研究的热点, 这里包括将稀疏损失函数与最大间隔思
    想融合的研究, 更加稀疏的鲁棒非凸稀疏损失函数的研究, 定义在簇、局部和分布上的稀疏损失函数
    的研究, 以及大规模或超大规模数据问题的稀疏损失模型与算法的研究.

数据分布之间的间隔

T. Zhang and Z. Zhou, “Optimal Margin Distribution Machine,” in IEEE Transactions on Knowledge and Data Engineering, vol. 32, no. 6, pp. 1143-1156, 1 June 2020, doi: 10.1109/TKDE.2019.2897662.

2. SVM 非线性学习

非线性学习是机器学习最重要的学习问题之一, 以 SVM 为代表的核方法为非线性学习提供了一
种非常好的实现路径. 然而, 如何寻找最优的核映射, 以及核方法如何有效应用于大规模问题等依然
有很长的路要走
. 展望的工作如下.

  • 核函数的构造及理论研究. 以上核函数对应的是 Hilbert 空间中的核映射, 而现实中不同数据
    结构 (字符串、图、空间数据等) 下可能需要构造相应的更广泛空间映射意义下的核, 如不定核 [32, 33]
    图核[34, 35] 等, 而对非 Hilbert 空间中的核映射研究还很不充分. 针对不同数据构造具有良好解释性
    的、适用性更广泛的、更易于计算的核, 并研究其统计学习意义下的性质和理论等有广阔的前景.
  • 大型核矩阵的存储与计算. 由于核方法中大多需要核矩阵, 而对于大规模问题而言, 核矩阵往
    往很大, 这对存储和计算都带来了困难. 如何求解相应的大型核矩阵是核方法发展的一个瓶颈. 构造
    适用于大规模问题的核模型与算法 (如随机核模型可并行计算的核模型[36, 37] 等) 都值得深入研究.
  • 寻找或选择最优核映射. 尽管文献 [31] 为学习最优核矩阵提供了良好的开端, 但实践中,
    何选择或构造出合适的核矩阵基底并求得最优核等问题尚未解决
    . 目前, 利用深度学习和启发式学
    习[38, 39] 等方式的研究为最优核学习提供了一个新的方向
    .
    此外, 核方法在其他机器学习问题中也大有可为.

3. 深度 SVM 与广度 SVM

深度学习和广度学习是当前大规模复杂数据问题的研究热点. SVM 作为一种特殊结构的神经
网络模型, 由于其核映射的非线性和稀疏性等特点, 在深度网络和广度网络的研究中也受到了关注. 但
是这方面的研究还很不充分, 许多基础理论问题尚未解决, 有效的模型和算法也不多. 因此, 存在着较
大发展潜力. 展望的研究工作如下.

  • 研究深度学习 SVM 的理论模型. 深度学习 SVM 的理论基础尚缺, 关于是否需要多层 SVM
    的争论还在继续. 近年来, 深度学习不同网络结构的研究取得了较大进展, 而不同网络结构的 SVM 模
    型研究才刚刚起步, 容易计算且可以解决大规模问题的深度 SVM 网络结构缺乏,
    这极大限制了 SVM
    在深度学习中的发展.
  • 研究深度 SVM 和广度 SVM 的算法. 多层非线性映射模型、稀疏损失的深度模型和多核学习
    模型的复杂度往往都很高, 这是制约深度 SVM 和广度 SVM 研究的现实问题. 如果能在存储和计算方
    面有所突破
    , 将为以上模型提供现实可行的路径.
  • 研究深度学习 SVM 与广度学习 SVM 的结合. 深度学习 SVM 与广度学习 SVM 模型都构
    造非线性映射从而构成最终的学习器
    , 它们都是研究复杂数据问题的有力手段. 如何针对特定的问题,
    将二者进行融合等是值得期待的新领域.
  • 研究可以实现端到端的深度和广度核模型与算法. 端到端将特征学习和学习器学习融为一
    体, 是深度学习的主要优点之一
    . 核映射具有广泛适用性, 构造核映射可以生成不同的特征. 可以期望
    利用深度学习和广度学习的网络结构, 构造出适当的核和学习器融合, 从而有效地实现端到端的学习
    过程.

Ref:邵元海,刘黎明,黄凌伟,邓乃扬.支持向量机的关键问题和展望[J].中国科学:数学,2020,50(09):1233-1248.

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值