质谱分类与肝脏纤维化智能诊断的机器学习方法
1. 质谱分类的机器学习方法
在质谱分类领域,支持向量机(SVM)是一种用于模式识别和数据挖掘分类任务的技术。虽然目前没有通用理论保证SVM具有良好的泛化性能,但大量文献表明它在不同领域表现出色。与前馈神经网络相比,SVM没有局部极小值问题,且需要选择的参数更少。
1.1 线性SVM
对于两类线性可分的模式向量,SVM的基本思想是找到一个线性表面,以最佳方式将点分为两组。最佳超平面是使间隔最大化的平面,即与两组点的距离最大。这一问题可以表述为一个有约束的二次优化问题:
- 原问题:
- 目标函数:$\min(\frac{1}{2}|w|^2)$
- 约束条件:$y_i(w^T x_i + b) \geq 1$,其中$y_i \in {-1, 1}$是类别标签,$w$是超平面的法向量,$\frac{2}{|w|}$是间隔。
- 对偶问题:
- 目标函数:$\max(L_D = \sum_{i} \alpha_i - \frac{1}{2} \sum_{i,j} \alpha_i \alpha_j y_i y_j x_i x_j)$
- 约束条件:$\sum_{i} \alpha_i y_i = 0$;$\alpha_i \geq 0$,其中$\alpha_i$是拉格朗日乘子。
- 解:$w = \sum_{i} \alpha_i y_i x_i$,$\sum_{i} \alpha_i y_i = 0$;$\alpha_i \geq 0$。
只有位于边际超平面上的数据点对应的$\alpha_i$不为零,这使得该技术对非边际点的扰动具有鲁棒性,这些点被称为支持
超级会员免费看
订阅专栏 解锁全文
631

被折叠的 条评论
为什么被折叠?



