5、机器学习中的回归模型与应用

机器学习中的回归模型与应用

1. 支持向量机(SVM)

支持向量机(SVM)和梯度提升机(GBM)代表了统计机器学习的前沿技术。SVM 能对高度非线性的数据集进行建模,这是其他学习算法难以做到的。它通过核技巧这种数学手段,模拟为数据增加维度的效果。原理是在 m 维空间中不可分离的数据,在 n 维空间中可能变得可分离。

例如,在二维数据集中,可能无法用一条直线分离不同类别,但添加第三个维度后,让靠近中心的点具有较高的 z 值,远离中心的点具有较低的 z 值,就可以用一个平面将不同类别的点完全分离。

SVM 主要用于分类,但也可用于回归。Scikit 中提供了相关类,如用于分类问题的 SVC 和用于回归问题的 SVR。

2. 回归模型的准确率衡量

2.1 训练与测试数据

训练模型需要一组数据进行训练,另一组数据进行测试。可以通过将测试数据传递给模型的 score 方法来评估模型的准确率。测试能量化模型预测的准确性,使用与训练数据不同的数据集进行测试非常重要,因为模型可能很好地学习了训练数据,但不一定能很好地泛化,即做出准确的预测。

2.2 数据分割问题

工程师常使用 Scikit 的 train_test_split 函数将数据集分割为训练集和测试集。但对于小数据集,不能完全信任模型 score 方法返回的分数。不同的随机种子值会导致 train_test_split 函数分割出不同的训练集和测试集,从而使 score 方法返回不同的值。

以下是一个简单的实验代码:

fro
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值