基于支持向量机的改进IP检测技术
1. 支持向量机概述
支持向量机(SVM)是一类用于数据分类的统计模型,在机器学习和人工智能领域广受欢迎。其目标是从有限的数据点集合中学习目标属性,以便对未见过的样本进行分类。在IP检测场景中,数据样本是功耗的哈希向量,估计的函数是这些向量是否属于要保护的IP类别。
1.1 二元支持向量机
标准的SVM模型是二元的,旨在估计布尔函数。它需要有监督(即有标注)的学习,训练数据集的每个样本都带有{−1, +1}的标签。其目标是为独立测试集的样本输出正确的标签。
决策函数为:
$g(x) = w^t\varphi(x) + b = w · \varphi(x) + b$ (1)
其中,$\varphi$ 是一个投影函数,将数据向量映射到更高(有时是无限)维的空间。参数 $b$ 和 $w$ 通过求解以下约束二次规划问题得到:
$\min_{w,b} \frac{1}{2}w^tw$
$\text{subject to } y_i * g(x_i) \geq 1, \forall i = 1, …, m$ (2)
当问题在约束条件下可行时,数据在特征空间中被称为线性可分。由于问题是凸的,保证能找到唯一的全局最小值。通常,求解器会计算相关对偶问题的解,得到决策函数的另一种形式:
$f_{classify}(x) = sign(\sum_{x_i\in SV} \alpha_i y_i K(x_i, x) + b)$ (3)
这里,$SV$ 表示支持向量的子集,对称核函数 $K$ 隐式考虑了投影 $\varphi$,$K(x_i, x_j
超级会员免费看
订阅专栏 解锁全文
1166

被折叠的 条评论
为什么被折叠?



