SVM推导简述

1.SVM思路

1.函数间隔和几何间隔:

点距离分离平面的远近可以代表分类预测的确信度,在超平面wx+b=0确定的情况下,|wx+b|表示点x距离超平面的远近,由于w,b可以成比例改变,超平面不变,所以需要对分离平面法向量进行约束,因此定义函数间隔和几何间隔分别为:

γ¯i=yi(wxi+b)γi=yi(wxi+b)||w||
求所有样本的间隔最小值得:
γ¯=mini=1,..,nγi¯γ=mini=1,...,nγi
2.线性可分间隔最大化:

直观理解:对最难分的点(离超平面最近的点)也要有足够大的确信度,因此可得到目标函数

maxw,bγyi(wxi+b)||w||γ,i=1,..,n
考虑几何间隔与函数间隔的关系,改写为
maxw,bγ¯||w||yi(wxi+b)γ¯,i=1,..,n
函数间隔γ¯可根据w,b成比例改变,因此可取任意值,将其设为1,由于最大化1||w||与最小化12||w||2等价,得到线性可分支持向量机,是一个凸二次规划问题(统计学习方法P100)
minw,b12||w||2yi(wxi+b)1,i=1,..,n
3.线性不可分加入松弛因子

不能完全把点分开时,在约束条件中加入松弛因子ξ,同时需要在目标函数中进行惩罚,并给出惩罚力度,得到线性支持向量机

minw,b12||w||2+Ci=1nξiyi(wxi+b)1ξi,i=1,..,n
4.转化为对偶形式

minα12i=1nj=1nαiαjyiyj(xixj)i=1nαis.t.i=1nαiyi=0,0αiC
此时,变量个数为样本长度,原问题变量个数为特征向量长度,只有支持向量α>0分开的xi变为向量内积方便使用核函数。当0<α<C,则ξ=0,支持向量落在间隔边界上;当α=C,0<ξ<1,分类正确,落在间隔边界和分离超平面之间;当α=C,ξ>1,分类错误。再求解w,b,其中b可以用间隔边界上(0<α<C)的一个点或所有点求平均得到
w=i=1nαiyixi,b=yji=1nyiαi(xixj)

2.SVM模型另一种解释

1.判别模型

f(x)=sign(wx+b)
2.参数

决策边界法向量w,和决策边界截距b

3.目标函数(损失函数+正则化项)

1.损失函数(hinge loss)

L(y,wx+b)=[1y(wx+b)]+
[z]+:当z>0时为z,z<0时为0。对于硬间隔SVM,损失函数为0,即使全部1yi(wxi+b)<0
2.目标函数:
Obj=i=1n[1yi(wxi+b)]++λ||w||2
最小化该目标函数等价于上述凸二次规划问题。令[1yi(wxi+b)]+=ξi,λ=12C可证明。
3. 目标函数决定了模型生成仅与支持向量有关,与其余大部分样本点无关
内容概要:本文针对国内加密货币市场预测研究较少的现状,采用BP神经网络构建了CCi30指数预测模型。研究选取2018年3月1日至2019年3月26日共391天的数据作为样本,通过“试凑法”确定最优隐结点数目,建立三层BP神经网络模型对CCi30指数收盘价进行预测。论文详细介绍了数据预处理、模型构建、训练及评估过程,包括数据归一化、特征工程、模型架构设计(如输入层、隐藏层、输出层)、模型编译训练、模型评估(如RMSE、MAE计算)以及结果可视化。研究表明,该模型在短期内能较准确地预测指数变化趋势。此外,文章还讨论了隐层节点数的优化方法及其对预测性能的影响,并提出了若干改进建议,如引入更多技术指标、优化模型架构、尝试其他时序模型等。 适合人群:对加密货币市场预测感兴趣的研究人员、投资者及具备一定编程基础的数据分析师。 使用场景及目标:①为加密货币市场投资者提供一种新的预测工具和方法;②帮助研究人员理解BP神经网络在时间序列预测中的应用;③为后续研究提供改进方向,如数据增强、模型优化、特征工程等。 其他说明:尽管该模型在短期内表现出良好的预测性能,但仍存在一定局限性,如样本量较小、未考虑外部因素影响等。因此,在实际应用中需谨慎对待模型预测结果,并结合其他分析工具共同决策。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值