Sklearn模型应用场景

本文介绍了Sklearn库中的knn、linearRegression、lasso、ridge、poly、logisticRegression、linearSVC、SVC和decisionTree等常见模型,强调了它们在不同场景下的适用性。同时,讨论了特征归一化的重要性,特别是对于regularized regression、logistic、knn、svm和neural networks等算法的必要性。并提到了模型参数调整对过拟合和欠拟合的影响。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Sklearn常见模型

knn:简单有效,适合作为基准模型,当数据量大时计算量会非常大,并且耗费内存

linearRegression: 运用最小二乘法实现的线性模型,当数据量大时计算效率不高

lasso: 添加L1正则化的线性模型,易获得权重的稀疏解,用于筛选特征

ridge: 添加L2正则化的线性模型,易获得权重的平滑解

poly: 多项式回归,容易过拟合,必须配合正则化使用

logisticRegression: 自带正则化实现,需要调节C控制正则化程度,较简单的分类模型

linearSVC: 线性支持向量机,自带正则化实现

SVC: 核支持向量机,默认是'rbf'核,调节C与gamma

decisionTree: max_depth控制过拟合,根节点深度为0

当模型过拟合时,增大alpha或者减小C;当模型欠拟合时,减小alpha或者增大C;

 

对特征归一化

某些机器学习算法要求输入数据必须有相同的范围:

  • regularized regression
  • logistic
  • knn
  • svm
  • neural networks

 

优缺点对比

  优点 缺点
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值