机器学习-总览

本文介绍了机器学习中的关键概念和技术,包括分类、过拟合及其缓解方法、支持向量机(SVM)、决策树的不同类型如ID3、C4.5、CART,以及随机森林等。还探讨了数据预处理技巧,例如特征选择、分桶时间方法、多项式特征的使用,并提醒在进行one-hot编码前需考虑数据分布。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.分类就是学习一个决策边界

2.过拟合和正则化(减缓过拟合的方法)

3.最大间隔分类器SVM,本身是线型切分,想变化成非线型切分是需要加入核函数,低纬度没办法切开所以要映射到高纬度当中切分。

4.决策树 ID3,c4.5,cart选特征,对应的筛选指标信息增益、增益率、基尼系数。

5.随机森林,选择部分特征,放回抽样。

6.分桶时间numpy.digitize(x,bin)取到桶的id

7.数据可能在不一样的段,采取不一样的模型,区分对待。

8.多项式特征,组合特征。

9.不要数据一对丢进来就做one-hot,先看分布情况。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值