15、机器学习中的模型优化与正则化技术

机器学习中的模型优化与正则化技术

1. 多项式逻辑回归模型

逻辑回归模型先对特征进行线性组合,再通过逻辑函数 $l(t) = \frac{1}{1 + e^{-t}}$ 将结果压缩到 $[0,1]$ 区间。这意味着我们可以像在线性模型中一样添加多项式项, regtools 包中的 qePolyLog() 函数就能实现这一操作。

1.1 职业预测示例

我们先使用非多项式逻辑回归来预测职业:

data(pef)
set.seed(9999)
qeLogit(pef,'occ')$testAcc

输出结果约为 0.646,考虑到有 6 个类别,约 35% 的准确率还算不错。接下来,我们尝试使用二次模型(即添加收入和年龄的平方项),看看是否能提高准确率:

set.seed(9999)
qePolyLog(pef,'occ',2)$testAcc

结果为 0.619,有轻微提升。但这可能是抽样误差吗?我们可以使用 qeCompare() 函数,通过多个保留集来比较不同阶数的多项式模型,以解决抽样问题。

2. 线性模型与其他方法的融合

2.1 k - NN 模型的边缘问题

以美国职业棒球大联盟球员数据为例,我们根据身高预测体重。数据的身高分布如下:


                
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值