线性模型特征选择与分类技术探究
在数据分析和建模领域,特征选择与分类技术是至关重要的环节。本文将深入探讨线性模型的特征选择,以及两种非线性分类技术:K - 最近邻(KNN)和支持向量机(SVM)。
线性模型特征选择与模型评估
在对某数据集进行分析时,我们使用了多种线性模型进行特征选择和建模。以下是部分模型系数的展示:
(Intercept) 0.04370343
lcavol 0.43556907
lweight 0.45966476
age .
lbph 0.01967627
svi 0.27563832
lcp .
gleason 0.17007740
pgg45 .
通过代码计算模型误差:
lasso.y.cv = predict(lasso.cv, newx=newx, type="response", s="lambda.1se")
lasso.cv.resid = lasso.y.cv - test$lpsa
mean(lasso.cv.resid^2)
此模型使用五个特征实现了 0.46 的误差,将 age、lcp 和 pgg45 的系数归零。
我们还对比了五种不同模型在测试集上的误差:
| 模型 | 测试集误差 |
| ---- | ---- |
|
超级会员免费看
订阅专栏 解锁全文
1679

被折叠的 条评论
为什么被折叠?



